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全国高等学校五年制本科临床医学专业 

第八轮 


全国高等学校五年制本科临床医学专业卫生部规划教材自1978年第一轮出版至今已有 
35年的历史。几十年来，在教育部、卫生部的领导和支持下，以裘法祖、吴阶平、吴孟超、陈灏珠 
等院士为代表的我国几代德高望重、有丰富的临床和教学经验、有高度责任感和敬业精神的国 
内外著名院士、专家、医学家、教育家参与了本套教材的创建和每一轮教材的修订工作,使我国 
的五年制本科临床医学教材从无到有，从少到多，从多到精，不断丰富、完善与创新，形成了课程 
门类齐全、学科系统优化、内容衔接合理、结构体系科学的由规划教材、配套教材、配套光盘、数 
字出版、网络增值服务组成的立体化教材 格局。 这套教材为我国千百万医学生的培养和成才提 
供了根本保障，为我国培养了一代又一代髙水平、高素质的合格医学人才,为推动我国医疗卫生 
事业的改革和发展做出了历史性巨大贡献，并通过教材的创新建设和高质量发展，推动了我国 
高等医学本科教育的改革和发展，促进了我国医药学相关学科或领域的教材建设和教育发展， 
走出了一条适合中国医药学教育和卫生事业发展实际的具有中国特色医药学教材建设和发展 
的道路，创建了中国特色医药学教育教材建设模式。老一辈医学教育家和科学家们亲切地称这 
套教材是中国医学教育的“干细胞”教材。 

本套第八轮教材修订启动之时,正是全球医学教育百年反思之际，更是我国医疗卫生体制 
改革和医学教育改革全方位深人推进之时,教育部、卫生部共同召开了全国医学教育改革工作 
会议,启动了 “5+3” 为主体的临床医学教育综合改革，形成了以医改推动教改，敎改服务医改的 
历史发展格局。人民卫生出版社和全国高等医药教材建设研究会紧紧抓住医学教育综合改革 
的历史发展机遇期，以全国高等学校五年制本科临床医学专业第八轮规划教材全面启动为契 
机，以规划教材创新建设，全面推进国家级规划教材建设工作,服务于医改和 教改。 

第八轮教材的修订原则是积极贯彻落实教育部、卫生部关于实施临床医学教育综合改革的 
意见,努力优化人才培养结构,坚持以需求为导向,构建发展以 “5+3” 模式为主体的临床医学人 
才培养体系;改革课程体系、教学内容、教学方法和评价考核办法:将医德教育贯穿于医学教育 
的全过程，强化临床实践教学，采取多种措施,切实落实好“早临床、多临床、反复临床”的要求， 
提高医学生的临床实践能力。 

在全国医学教育综合改革精神鼓舞下和老一辈医学家奉献精神的感召下，全国一大批临床 
教学、科研、医疗第一线的中青年专家、学者、教授继承和发扬了老一辈的优秀传统，以严谨治学 
的科学态度和无私奉献的敬业精神，积极参与第八轮教材的修订和建设工作，紧密结合五年制 
临床医学专业培养目标、高等医学教育教学改革的需要和医药卫生行业人才的需求，借鉴国内 
外医学教育教学的经验和成果，不断创新编写思路和编写模式,不断完善表现形式和内容，不断 
提升编写水平和质量，已逐渐将每一部教材打造成了学科精品教材，使第八轮全套教材更加成 
熟、完善和科学，从而构建了适合 “5+3” 为主体的医学教育综合改革需要和卓越临床医师培养需 
求的教材体系，推动了适合中国国情的五年制本科临床医学专业课程体系的建设。 



本次修订和编写特点 如下： 


1. 教材编写修订工作是在教育部、卫生部的领导和支持下，按照 “5+3” 为主体的临床医学 
教育综合改革的时间表、路线图和施工图进行顶层设计,由全国高等医药教材建设研究会规划， 
全国临床医学专业教材评审委员会审定，院士、专家把关，全国各医学院校知名专家、教授编写， 
人民卫生出版社高质量精品出版。 

2. 教材编写修订工作是根据教育部培养目标、卫生部行业要求、社会用人需求,在全国进行 
科学调研的基础上,借鉴国内外医学人才培养模式和教材建设经验,充分研究论证本专业人才 
素质要求、学科体系构成、课程体系设计和教材体系规划后，科学进行的。 

3. 在全国广泛、深人调研的基础上,总结和汲取了前七轮教材的编写经验和成果，尤其是对 
一些不足之处进行了大量的修改和完善,并在充分体现科学性、权威性的基础上,更考虑其全国 
范围的代表性和适用性。 

4. 教材编写修订工作着力进行课程体系的优化改革和教材体系的建设创新一科学整合 
课程、淡化学科意识、实现整体优化、注重系统科学、保证点面结合。继续坚持“三基、五性、三特 

j 定”的教材编写原则，以确保教材质量。 

5. 为配合教学改革的需要、减轻学生负担和体现“干细胞”教材特色,全套教材精炼文字、 
压缩字数，注重提高内容质量，并根据学科需要，采用大 16 开国际开本、双色或彩色印刷，以提 

I 高印装质量和可读性。同时，在每一页都增加了留白，便于学生记录和标记书中重点知识。 

6. 为满足教学资源的多样化需求，实现教材系列化、立体化和数字化建设，大部分教材配有 
配套教材和数字出版的教学资料,并实现了全套教材的网络增值服务，方便老师教学和学生自 
主学习，实现了数字化资源共享。 


第八轮教材共有53种，其中新增2种，即《医患沟通》和《肿瘤学概论》;更名1种， E 卩《急诊 
医学》更名为《急诊与灾难医学》;合并2种,即《生物化学》与《医学分子生物学》合并为《生物 
化学与分子生物学》。全套教材均为“十二五”普通高等教育本科国家级规划教材(除《肿瘤学 
概论》外)和卫生部‘‘+二五，，规划教材，于2013年6月全部出版发行。 

本套教材是在我国医学教育综合改革，构建“5+3” 为主体的临床医学人才培养体系背景下 
组织编写的，希望全国各广大院校在使用过程中能够多提供宝贵意见,反馈使用信息，以逐步修 
改和完善教材内容,提高教材质量,为第九轮教材的修订工作建言献策。 
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顾 问 

沈晓明王德炳刘德培吴孟超刘允怡 

.主任委员 

陈灏珠钟南山 

副主任委员 

王卫平杨宝峰龚非力柯杨石应康郑树森 

委 员（以姓氏笔画为序） 

王滨王冠军王家良王鸿利文历阳文民刚文继舫 
孔北华田勇泉白波白人驹冯友梅吕兆丰朱明德 
刘吉成闫剑群李玉林步宏吴在德吴肇汉汪建平 
沈悌陆再英郎景和赵群赵玉沛南登崑柏树令 
曹雪涛崔慧先葛均波曾因明曾晓荣雷寒瞿佳 



高水平、高质量的医学教育既是办好人民满意教育的重要组成部分,也是医疗卫生事业改 
革发展的重要支撑。随着我国医药卫生体制改革的不断深人,对高等医学教育改革也提出了更 
高的要求。如何培养适应国家需要、人民满意的高质量、高水平医学人才是当前医学教育的首 
要任务。为此，在“十二五”开局之年，教育部和卫生部共同组织实施了医学教育综合改革。 

医学教育综合改革要求我们深人贯彻落实教育规划纲要和医药卫生体制改革的意见,遵循 
医学教育规律,以改革创新为动力,着力于医学教育发展与医药卫生事业发展的紧密结合,着力 
于人才培养模式和体制、机制的重点突破，着力于医学生职业道德和临床实践能力的显著提升， 
着力于医学教育质量保障体系的明显加强，从而全面提高医学人才培养质量，为发展医药卫生 
事业和提高人民健康水平提供坚实的人才保障。 

教材建设在提高人才培养质量中发挥着重要的基础性作用，对此教育部一直高度重视，要 
求以教材建设为抓手，推动医学课程和教学方法改革。一本好的教材，给医学生以正确的引导， 
j 给临床医生以正确的指导。人民卫生出版社作为国家级优秀出版单位，承担了大量教材的规划 
和出版工作，形成了课程种类齐全、学科体系合理、配套服务全面的教材出版模式。尤其是在以 
吴阶平、裘法祖、吴孟超、陈灏珠等院士为代表的老一辈医学大家的付出和带领下，在一大批医 
学教育精英的努力和参与下，其出版的五年制本科临床医学专业规划教材为我国医学界培养了 
-ftx —代优秀的医药学人才，为推动我国医疗卫生事业的改革和发展做出了巨大的历史贡献。 

此次第八轮五年制本科临床医学专业规划教材的修订工作是在贯彻党的十八大关于“深化 
( 教育领域综合改革”精神的背景下，在落实卫生部、教育部联合下发的《关于实施临床医学教育 
综合改革的若干意见》的基础上启动的。修订工作贯穿了医学教育综合改革的要求，特别是注 
重将医德教育贯穿于医学教育的全过程,增加了《医患沟通》一书,同时强化临床实践教学，配套 
编写了相关的实践指导，以提高医学生的临床实践能力。 

我们相信，在教育、卫生系统的通力合作下，在广大医学教育工作者的大力支持和参与下， 
第八轮五年制本科临床医学专业规划教材的修订出版对推动医学教育综合改革,提高医学人才 
培养质量将产生积极的推动作用。 


教育部部长助理 


2013年3月 


与斌荥 

男，1938年4月生于上海。教授，博士生导师。1962年毕业于复旦 
大学数学系概率统计专业，之后在北京首都医科大学任教，享受国家国 
务院特殊津贴。现任中国卫生部国家医师资格考试中心专家委员会专 
家、北京市医疗器械评审专家委员会荣誉专家、高等院校教育技术协会 
. 学术委员会委员兼副秘书长。 

从事教学工作50年，人民卫生出版社、全国高等学校医学五年制 
教材《医学统计学》第3~5版主编。在科研方面，“中医关幼波教授对肝 
炎的辨证施治电子计算机程序”获北京市科学技术进步奖一等奖，“医 
学图像三维重构”获北京市科学技术进步奖二等奖，“虚拟现实三维多 
媒体中枢神经解剖学 CAI 课件”获北京市高等教育教学成果一等奖，“医 
学病例案例库”获北京市高等教育教学成果二等奖。主编《中医专家系 
统与中医知识库》(北京出版社),编著 《SPSS for windows 在医学统计中 
的应用》第1~4版(科学出版社)。曾获首届吴阶平优秀教师奖、北京市 
有突出贡献专家。 



男， 1957 年10月生于黑龙江省哈尔滨市。博士，教授，博士生导 
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医学统计学是现代医学研究中的一门基础学科,是关于收集数据和分析数据的科学。医学 ! 

研究中，由于生物现象的变异较大，各种因素错综复杂，实验或观察结果往往受到多种因素的 i 
影响，而统计学的重要作用就在于能够透过偶然现象来探索其规律性，并以适当的方式将研究 j 

结果表达出来。医学统计学作为建立统计分析思维的必修课程，有助于医学生在专业学习和临 
床实践中更好地阅读文献和进行科学研究。随着计算机统计软件的广泛应用，复杂的统计学计 
算问题能够快速方便地得到解决，这就要求使用者对统计学的基本原理、方法及其应用条件有 I 

一定的了解和熟悉，并且能够看懂数据分析的结果。为此,本书注重结合医学实例介绍统计学 
原理和方法,而不拘泥于繁杂的计算过程，使其适合医学生和医学研究人员使用。 

本教材在第5版《医学统计学》基础上做出适当调整。在内容上，增加了目前应用较为广泛 
的一些统计学方法，如重复测量数据分析、 logistic 回归分析、生存分析、临床试验设计和样本含 | 

量估 计等; 统计图表一章增加了撰写科研论文时经常使用的几种统 计图； 附录一给出了国际上 
临床随机对照试验 (KCT) 研究报告的参考标准 (2010); 附录二给出了 SPSS 软件对各章实例分 | 

析的实现方法。例题选择上，尽量使用临床和基础研究的实际范例。在各章的习题中，增加了 
单项选择题的数量,有助于读者对正文内容的深人理解，还可作为执业医师资格考试的参考资 
料。各高校可以根据教学条件选择合适的教学内容，参考教学时数为32~54学时，部分章节可 
作为自学内容。 

本书的主要特点是内容简洁,通过实例讲解统计学名词、概念、原理和方法，尽量简化复杂 
的运算过程。为了更好地使用本教材，改进了原有的教学配套 PPT 课件,并由第二军医大学的 | 
吴骋老师结合各章例题,制作了 SPSS 统计软件的视频教学。 PPT 课件、 SPSS 视频教学及教材中 j 

练习题的参考答案一并放人教材的网络增值服务中。 

由于编者水平和时间所限，书中错误和疏漏之处恐在所难免,诚恳希望广大读者批评指正。 


李康 

2013年2月于哈尔滨 
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第一章绪 论 


在本章中，我们将给出医学统计学的定义和研究对象,并用实例说明医学统计学在医学研 
究中的重要作用，同时简要介绍医学统计学包含的基本内容。在此基础上，重点学习医学统计 
学中的几个基本概念。 

第一节 医学统计学的作用 

医学统计学 (medical statistics) 是临床医学、基础医学、公共卫生学和医疗卫生服务研究中 
的一门基础学科，是关于收集数据、分析数据和由数据得出结论的一组概念、原则和方法。医 
学研究中，由于生物现象的变异较大，各种因素错综复杂，由实验或观察得 a 的结果往往会受 
到许多随机因素的影响，如使用两种药物治疗冠心病，试验药物和对照药物有效率分别为87% 

和82%,这种结果能否说明试验药物优于对照药物？由样本数据获得的结果，其差别既可能是 
药物本身作用引起，也有可能是随机波动所致，是否由于药物作用造成了两组疗效的差别，需 | 
要使用统计学方法进行推断。统计学的重要作用在于能够透过偶然现象来探测其规律性，使研 
究结论辟科学性。 

为了理解统计学在实际工作中的作用和意义,现通过两个经典案例来说明。 

1. 1962年美国医学学会杂志 (JAMA) 曾发表了一篇关于胃溃疡治疗新技术的报告，该报告 
根据动物实验和24名患者的临床试验结果得出结论，即将冷冻液导入胃中使胃冷却可以缓解 
溃疡症状，之后这一研究成果在临床中被广泛应用。但有研究者发现，这项研究在设计上存在 
严重问题，如未合理地设立对照组。后经过严格的随机对照试验，证明胃冷却的方法只是暂时 
性的缓解胃部疼痛，该法不仅不能治疗胃溃疡，反而可能会加重胃部的溃疡，从而否定了这种 
治疗胃溃疡的方法。 

2. 20世纪80年代早期，两项观察性研究结果提示孕妇在怀孕期间补充维生素可以降低新 
生儿神经管缺陷 (neutral tube defect, NTD) 的风险，但一直无法证实。医学研究委员会维生素研 
究小组于1991年开展了一项大规模的随机对照试验，结果显示： 593名服用叶酸 (B 族维生素） 
的女性中，6名新生儿患有神经管缺陷； 602名没有服用叶酸的女性中，21名新生儿患有神经管 
缺陷。该项研究使用统计学方法确定了服用叶酸组与对照组的差别不是简单偶然出现的，而是 
归因于叶酸的作用。 

根据上述两个实例，我们可以提出以下几个问题： 

(1) 胃溃疡治疗新技术的研究结论为什么会出现错误？ 

(2) 为了证明服用叶酸的作用，应如何进行分组？ 

(3) 如何准确地估计两组新生儿中出现神经管缺陷 (NTD) 的发病率？ 

(4) 如何比较两组 NTD 的发病率是否有差别？ 

以上这些问题的解决,都需要运用统计学设计原则和统计分析方法。 

综上，医学统计学的研究对象是医学中具有不确定性结果的事物，其主要作用是通过数据 
的偶然性揭示内在的规律性。统计分析的要点是正确地选用统计分析方法，并结合专业知识作 
出科学的 结论。 医学工作者通过学习和运用统计学方法，可以更好地理解医学专业杂志的内I 
容、撰写科学论文、加强与统计专业人员沟通的能力，从而达到提高科研水平的目的。 
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第二节医学统计学的基本内容 


医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。这四项基本内容 
相互联系。 

1. 统计设计医学研究主要包括实验性研究和观察性研究。研究设计有专业设计和统计 
设计，两者相辅相成。专业设计主要包括：选题、根据研究目的确定研究对象、处理因素、实验 
或观察方法、实验材料和设备、实验效应或观察指 标等； 统计设计主要包括实验分组或抽样方 
法' 样本含量估计、数据管理与质量控制、拟使用的统计分析方法等。由于研究设计上的错误 
在数据分析阶段无法更正,所以在研究开始时就应与统计专业人员合作或向其咨询。统计设计 
能够提高研究效率,并使结果更加准确和可靠。 

2. 数据整理数据整理主要是指对数据质量进行的检查，考虑数据分布及变量转换，检査 
异常值和数据是否符合特定的统计分析方法要求等。有效数字使用以同一形式表达，使人容易 
领会并确信在实验或观察过程中数据的精密度始终保持一致。医学研究中，当观测到的偏差比 
合理预期大时,应当仔细考虑，如果没有充分的理由说明它是不合理的，就应当予以 保留； 随意 
将那些自认为“过大或过小”的数据舍弃掉，不仅可能使实验研究的真实性受到破坏，还有可能 
失去新发现的机会(如基因突变)。 

3. 统计描述统计描述用来描述及总结一组数据的重要特征，其目的是使实验或观察 

| 到的数据表达清楚并便于分析。通常，统计描述给出资料的大致轮廓和进一步分析的方向，结 
果的表达方式主要是统计指标、统计表和统计图。统计指标的作用是把大量数据用简单的数字 
表达它的一些重要特征，帮助形成对总体的看法，如数据的平均水平和变异程度。统计表是编 
r 写统计分析报告和撰写科学论文必不可少的表达形式，其作用是可以代替冗长的文字叙述，便 
于分析和对比。统计图能够更生动、形象地表达结果，给人以深刻印象。统计图表的正确使用 
对撰写科学论文的质量有很大的影响。如果一组数据是整个总体的观察结果，统计描述即可得 
出明确的结论,但更多情况是数据来自随机抽取的样本，这时还需要使用统计推断方法。 

4. 统计推断统计推断指由样本数据的特征推断总体特征的方法，包括参数估计和假设检 
验。参数估计分为点估计和区间估计。区间估计的重要性在于可以得出估计不准的概率。例 
如，在研究某种新药的降压效果时,舒张压治疗前后差值的95%可信区间为 10.41~13.05mmHg, 
即真实差值没有被包含在这一区间内的概率只有5%。假设检验则是从另一角度去分析数据， 
重点是比较参数的大小。由于存在生物个体变异和随机测量误差，不能简单地根据样本计算出 
的结果直接判断总体的情况。如欲比较甲乙两种治疗高血压药物的疗效，试》结果显示甲药平 
均降压 llmmHg, 乙药平均降压 7mtnHg, 由于抽样误差的影响，并不能说明甲药的降压效果优 
于乙药，重新再做一次试验很可能会得到相反的结果。假设检验的作用是能够辨别出由随机波 
动引起这种差别的概率大小，如果概率很小(如/ ><0.05), 则可以得出甲药优于乙药的结论。不 
同类型的数据可以用相应的统计方法作分析，如 < 检验、方差分析、; c 2 检验、相关性分析、多元回 
归分析等。各种假设检验得到的/>值是得出结论的主要依据。 

第三节医学统计学中的基本概念 

、同质与变异 

同质 (homogeneity ) 是指根据研究目的所确定的观察单位其性质应大致相同。观察单位是 
研究的基本单元，可以是一个人、一个地点.一只动物、一份生物样品等。然而，即使性质相同 
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的事物，如果观察同一指标，各观察单位之间由于存在个体差异，也会使测量结果不同，这种差 
异称为变异 (variation)。 医学研究的对象是有机的生命体，其机能十分复杂，不同的个体在相同 
的条件下，对外界环境因素可以产生不同的反应。例如，同种族、同年龄、同性别的健康人，在 
相同的条件下测其脉搏、呼吸、体温等生理指标均可能存在很大的差异。在临床治疗中，用同 
样的药物治疗病情相同的病人，疗效也不尽相同。即使在相同条件的实验室里.不同动物之间 
的各项指标也有明显的差异。变异是生物个性的反映，若所研究的同质群体中所有个体完全 
相同，只需观察任意一个个体即可，无须使用统计学进行研究。个体间的变异来源于一些未加 
控制或无法控制、甚至不明因素所致的随机波动。例如研究儿童的身高时，要求性别、年龄、民 
族、地区等影响身高较大的、易控制的因素要相同，而不易控制的遗传、营养等影响因素则可以 
忽略。 

由于医学统计学研究的对象是有变异的事物，因此无法用 1-2 例的观测结果推论出一般规 | 
律。例如，我们不能用某一健康成人的红细胞数作为一般健康成人的红细 胞数； 也不能因为使 
用某一种药物治疗一例冠心病患者有效，就断定这种药物治疗冠心病有效。科学研究工作的主 
要任务之一是要从表现为偶然性的大量数据中，分析出其中必然性的规律，而统计学就是解决 
这一问题的有效工具。 

-- 变量与数据类型 

变量 Uariable) 是反映实验或观察对象生理、生化、解剖等特征的指标，变量的观测值称为 
数据 (<km)。 例如，体温是一个变量，它随着时间的变化而变化，也会因个体的差异而 不同； 身 
高、体重、性别、年龄、血型、疗效等都是变量，它们的观测值称为数据。具体可分为定量数据 
(quantitative data), 定性数据 (qualitative data) 和有序数据 (ordinal data ) 三种数据类型。 

1. 定量数据也称计量资料。变量的观测值是定量的，其特点是能够用数值大小衡量其 
水平的高低，一般有计量单位。根据变量的取值特征可分为连续型数据和离散型数据。连续型 
定量数据具有无限可能的值，例如身高、体重、血压、温度等。离散型定量数据通常只能取正整 
数,例如家庭成员数、脉搏、白细胞计数等。 

2. 定性数据也称计数资料。变量的观测值是定性的，表现为互不相容的类别或属性。 
通常情况下，定性数据指类别(属性 ) 之间没有程度或顺序上的差别，它可以进一步分为二分类 
和多分类，如性别分为男和女，血型分为六、15、038等。 

3. 有序数据也称半定 M 数据或等级资料。变量的观测值是定性的，但各类别(属性)之 
间有程度或顺序上的差别，如尿糖的化验结果分为-、+、++、+++,药物的治疗效果按照显效、 
有效、好转、无效分类等。 

统计分析方法的选用与数据类型有密切的关系。根据分析的需要，不同类型的变 fl 或数据 
之间可以进行转换。例如原始的血红蛋白为定量数据，如果将血红蛋白分为正常与异常两类， 
则可以根据需要按照二分类定性数据进行 分析； 如果将其分为正常、轻度贫血、中度贫血、重度 
贫血四个等级时 ，则可 以根据需要按照有序数据进行分析。 

三、总体和样本 

总体 (population) 是根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围 
内的个体变量值。样本 (sample) 是从研究总体中柚取部分有代表性的观察单位，对变量进行 | 
观测得到的数据。例如，在特定社区中随机选取200名成年男子进行体检，测其基本的生命体 
征 ：身高 、体重、血压、脉搏、心率。在这个例子中，有5个变量，分别为身高、体重、血压、脉搏 
和心率，观察单位是随机抽取的每个成年 男子； 如果感兴趣的总体是该社区的全部成年男性 



究总体可以包括无限的个体,例如研究尿激酶原治疗心肌梗死的疗效，这里总体同质的基础是 
有心肌梗死的患者和接受尿激酶原治疗的患者，没有时间和空间的限制。无论有限总体还是 
无限总体,我们把描述总体特征的指标称为参数 (parameter), 描述样本特征的指标称为统计量 
(statistic)„ 为了保证总体的同质性和样本的可靠性与代表性，应当严格确定总体范围，用随机 
化的方法选择有代表性的样本,进行正确而有效的研究设计。 

四、 误 差 

误差 (error) 是指观测值与真实值、样本统计量与总体参数之间的差别。根据误差的性质和 
来源主要可以分为系统误差 (systematic error)、 随机测量误差 (random measurement error) 和抽样 
误差 （sampling error) 几种类塑。 

1. 系统误差有时也称作统计偏倚。系统误差由一些固定因素产生，如仪器未进行归零 
校正、标准试剂校准不好、测量者读取测量值不准、试验对象选择不合适、医生对疗效标准掌握 
偏高或偏低等原因。系统误差的大小通常恒定或按照一定规律变化,具有明确的方向性。这类 
误差可以通过周密的研究设计和测量过程标准化等措施加以消除或控制。 

2. 随机测量误差在测量过程中，即使仪器初始状态及标准试剂已经校正，但由于各种偶 
然因素的影响也会造成同一测量对象多次测定的结果不完全相同，这种随机产生的误差称为随 
机测量误差。实际中，产生随机测量误差的主要原因是生物体的自然变异和各种不可预知因素 
产生的误差,这种误差往往没有固定的大小和方向，但具有一定的统计规律(如服从正态分布)。 
随机测量误差不可避免，但可以通过多次测量获得的均数对真实值进行准确的估计。 

3. 抽样误差抽样误差是随机误差中最重要的一种误差。由于生物的个体变异，从总体 
中随机抽取一个样本进行研究，所得样本统计量与相应的总体参数往往不相同，这种由于抽样 
而引起的样本统计量与总体参数间的差异，在统计学上称为抽样误差。抽样误差主要来源于个 
体的变异，如果没有个体变异，就不存在抽样误差。抽样误差可以用统计方法进行分析，一般 
来说,样本含量越大，则抽样误差越小，样本统计量与总体参数越接近。 

五. 概 率 


概率 (probability) 是描述某事件发生可能性大小的度量。事件 A 发生的概率可以写成尸 (A), 
其取值范围为0奸 (A)S1。 尸 (A)=0 表示该事件不可能发生，尸 (A)=l 表示该事件必然发生。 
概率也可以用稳定的频率进行解释，即在大量的观察或试验中，事件 A 出现的相对频率。如某 
地区调査了 20000名成年人的高血压患病情况，结果有4000人患病，估计该地区的人群患病率 
为20%；若从该地区随机抽取一名成年人,则估计该对象患有高血压病的概率为20%。医学数 
据的一个重要特征是其不确定性,这种不确定性可以使用概率表达。若要全面了解试验，则必须 
知道试验的全部可能结果及各种结果发生的概率，即必须知道随机变量的概率分布 (probability 
distribution), 如血型的分布。 

在统计学上，统计推断的结论都是基于一定概率得出的，习惯上将尸<0.05的事件称为小概 
率事件，表示在一次试验中发生的可能性很小。如果小概率事件在现实中出现，就要追究其原 
因。如对两种药物降压效果的差别进行假设检验，由于抽样误差的存在，无论两种药物的疗效 
是否有差别，两个样本均数之间总会存在一定的差异，这种差异是否由于抽样误差造成，需要 
通过尸值来确定。如果 P^0.05 则说明当前试验结果显示的差别是由于“偶然”所致的可能性不 
足5%,因此可以做出有差别的结论。 



单项选择题 

医学统计学研究的对象是 （） 

A. 医学中的小概率事件 B. 各种类型的数据 

C. 动物和人的本质 D. 有变异的医学事物 

E. 疾病的预防与治疗 

用样本推论总体，具有代表性的样本通常指的是（ ） 

A. 总体中最容易获得的部分个体 B. 在总体中随意抽取的任意个体 

C. 挑选总体中的有代表性的部分个体 D. 用方法抽取的部分个体 

E. 依照随机原则抽取总体中的部分个体 


下列观测结果属于有序数据的是 （） 

A. 收缩压测量值 
C. 住院天数 
E. 四种血型 

随机测量误差指的是 （） 

A. 由某些固定的因素引起的误差 
C. 选择样本不当引起的误差 
E. 由操作失误引起的误差 
系统误差指的是（ ） 

A. 由某些固定的因素引起的误差 
C. 选择样本不当引起的误差 
E. 由不可预知的偶然因素引起的误差 
抽样误差指的是（ ） 

A. 由某些固定的因素引起的误差 
C. 选择样本不当引起的误差 
E. 由不可预知的偶然因素引起的误差 
收集数据不可避免的误差是 （） 

A. 随机误差 
C. 过失误差 
E. 仪器故障误差 

统计学中所谓的总体通常指的是 （） 

A. 自然界中的所有研究对象 
C. 同质观察单位的全体 
E. 具有代表性意义的数据 
统计学中所谓的样本通常指的是 （） 

A. 可测量的生物性样品 
C. 某一变量的测量值 
E. 总体中有代表性的部分观察单位 
医学研究中抽样误差的主要来源是 （） 
A. 测量仪器不够准确 


B. 脉搏数 
D. 病情程度 


B. 由不可预知的偶然因素引起的误差 
D. 选择总体不当引起的误差 


B. 由操作失误引起的误差 
D. 样本统计量与总体参数间的误差 


B. 由操作失误引起的误差 
D. 样本统计量与总体参数间的误差 


B. 系统误差 
D. 记录误差 


B. 概括性的研究结果 
D. 所有的观察数据 


B. 统计量 

I).数据中有代表性的一部分 


B. 检测出现错误 






第一章绪 论 


C. 统计设计不合理 D. 生物个体的变异 

E. 样本量不够 

简答题 

1. 医学统计学的主要作用是什么？ 

2. 医学统计学包括哪些基本内容? 

3. 统计描述与统计推断的主要特点是什么？ 

4. 统计量与参数的差别是什么？ 

5. 常见的三类误差是什么？应采取什么措施和方法加以控制？ 

6. 研究尿激酶原治疗心肌梗死的疗效，以瑞替普酶作为对照，该项研究共包含几个 


(李康） 





第二章定量数据的统计描述 


本章学习定量数据的统计描述方法。这一部分的内容主要包括频数表、直方图和统计指 
标。利用频数表和直方图可以清楚地揭示数据的分布类型和特征，统计指标则可以概括性地描 
述一组数据的集中趋势或平均水平。学习这些方法的目的在于能够有效地组织、整理和表达统 
计数据的信息。 

第一节频数分布 

通过实验或观察等各种方式得到的原始数据，如果是定量数据并且观察的例数较多，可以 
对数据进行分组，然后制作频数表或绘制直方图，用以显示数据的分布规律。 

一、 频数表 

频数表 (frequency table) 是统计表的一种，它同时列出观察指标的可能取值区间及其在各区 
间内出现的频数。具体 做法： 先根据观察个体的数值大小进行分组，然后计算每组中观察值 
岀现的次数。由于这种数据表达方式较完整地体现了观察值的分布规律，所以也称作频数分 
布表。 

在编制频数表时，通常先将选定的组列岀，每一组段的起点称下限，终点称上限(上限一般 
不列出），然后将原始数据归到不同的组段中，最后计算不同组段中数据的个数，即可得到各组 
的频数。 

现结合实例说明频数表的编制方法和应注意的问题。 

例 2-1 某地用随机抽样方法检查了 140名成年男子的红细胞计数，检测结果如表 2-1 所示。 

__ 表 2-1 某地140名成年男性 红细胞数 (x 10 12 /L) 

4.76 5.26 5.61 |M5| 4.46 4.57 4.31 5.18 4.92 4.27 4.77 4.88 

5.00 4.73 4.47 5.34 4.70 4.81 4.93 5.04 4.40 5.27 4.63 5.50 

5.24 4.97 4.71 4.44 4.94 5.05 4.78 4.52 4.63 5.51 5.24 4.98 

4.33 4.83 4.56 5.44 4.79 4.91 4.26 4.38 4.87 4.99 5.60 4.46 

4.95 5.07 4.80 5.30 4.65 4.77 4.50 5.37 5.49 5.22 4.58 5.07 

4.81 4.54 IMil 401 489 4.62 5.12 4.85 4.59 5.08 4.82 4.93 

5.05 4.40 4.14 5.01 4.37 5.24 4.60 4.71 4.82 4.94 5.05 4.79 

4.52 4.64 4.37 4.87 4.60 4.72 4.83 5.33 4.68 4.80 4.15 4.65 

4.76 4.88 4.61 3.97 4.08 4.58 4.31 4.05 4.16 5.04 5.15 4.50 

4.62 4.73 4.47 4.58 4.70 4.81 4.55 4.28 4.78 4.51 4.63 4.36 

4.48 4.59 5.09 5.20 5.32 5.05 4.41 4.52 4.64 4.75 4.49 4.22 

4.71 5.21 4.94 4.68 5.17 4.91 5.02 4.76 ___ 

1 • 确定组数进行数据分组时首先应考虑组数，分组过少会导致信息损失 较大； 分组过多 
则可能使数据分布的规律性不能明显地表示出来。通常情况下组数选择在8〜15之间，以能显 
示数据的分布规律为宜。 

2. 确定组距分组时必须事先规定组距，组距的宽度按相邻两组的下限之差计算 ，一 般应 






第二章定量数据的统计描述 


取相同的组距。将全距除以组数可以得到组距的近似值。全距即数据中最大值与最小值之差， 
如果用及表示全距从表示组数，则参考组距为及从。组距的选择应符合专业习惯，得到参考组 
距后再结合实际情况作适当地调整。如表 2-1 数据中的最大值为5.95,最小值为 3.82, 全距为 
2.13, 现拟分10个组，参考组距为 

; = U 0 . 21 

k 10 

因为通常比较习惯含有 0.20 或 0.25 个单位倍数的区间宽度，因此可以在 0.20 和 0.25 两种 
组距中选择。若用 0.20 作为组距，则总共有11个 区间； 若用 0.25 作为组距，则有9个区间。权 
衡后选择组距为 0.20 比较合适。 

有些资料因为数据中有特大或特小的数值也可以采用不等组距，如某些食物中毒的潜伏 
期，大部分在短时间内出现症状，只有极少部分人经过较长的时间后才有^应，这种情况可以 
将后面的一些组段作适当的合并，并可以将最后一个组段以“大于……”表示，以避免出现一些 
组段频数为零的情况。 

3. 确定组限一个频数分布必须包括整个资料范围的全部数据，即一个数据必须能够归 

属于某一组，同时只能归属于一个组，不能兼属。为此，实际组限在每组中只包含下限而不包 
含上限,如第一组为 “3.80-” 、 第二组为 “4.00-” ， 凡小于 4.00 者均应分入第一组，达 4.00 者则在 
第二组 。 * 

4. 确定频数由原始数据可得例 2-1 的频数表，如表 2-2 所示。 


表 2-2 某地140名正常男性红细胞计数的频数表 



二直方图 


将表 2-1 的资料编成频数表后，可以看出数据的分布情况，若绘制成直方图 （ histo gram) 则 
更直观。直方图是以垂直条段代表频数分布的一种图形，条段的高度代表各组的频数，由纵 
轴 标度； 各组的组限由横轴标度，条段的宽度表示组距。如将表 2-2 资料绘制直方图，如图 2-1 

从图 2-1 明显看出该地区正常成年男性红细胞数的分布 特点： 数据多集中在 4.80 x 10 12 /L 附 
近，两侧对称下降，最小值不低于 3.80M0 I2 /L, 最大值不超过 6.00x 10 12 /L。 绘制直方图的频 
数表资料一般为等距分组，对于不等距资料应先将不等距的各组频数折算为等距频数，然后再 
作图。 
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红细胞数 (x 10 ,! /L) 


图 2-1 140名正常成年男性红细胞计数的直方图 


三、频数分布表的用途 

1 . 作为陈述资料的形式,可以代替原始资料,便于进一步分析。 

2. 便于观察数据的分布类型。医学研究中常见的资料分布类型可分为对称分布和偏态分 
布两大类。在对称分布资料中，正态分布 (normal efotribution) 是一种非常重要的分布类型，其特 
征是中间组段的频数最多，两侧的频数分布对称，并按一定的规律下降，表 2-2 的频数分布即近 
似虽正态分布(参见图2-1)。如果频数分布的高峰向左偏移，长尾向右侧延伸称为正偏态分布， 
相反则称为负偏态分布。在统计分析时常需要根据资料的分布形式选择相应的统计分析方法. 
因此对数据分布形式的判定非常重要。 

3. 便于发现资料中某些远离群体的特大或特小值。如在频数表中连续出现0的频数后，又 
出现了一些频数就值得怀疑，应进行检查和核对,必要时可通过统计检验决定取舍。 

4. 当样本含量比较大时，可用各组段的频率作为概率的估计值。如表 2-2 第 ( 3 )栏的频数 
除以总例数即为第 (5) 栏的频率，由此可推测成年男子的红细胞计数值出现在各组段的概率分 
别为 0.014, 0.043,0.079 ，…，0.007。 

总之,通过频数分布表和直方图，可以大致看出观察资料的形态和特征。如果需要进一步 
用数字概括、明确地描述频数分布的特征则应使用统计指标描述的方法。 

第二节集中趋势的统计指标 

平均数 (average) 是描述一组观察值集中位置或平均水平的统计指标，它常作为一组数据的 
代表值用于分析和进行组间的比较。平均数有多种，常用的有算术均数、几何均数和中位数等。 

一、算术均数 

算术均数 (arithmetic mean) 简称为均数，用于说明一组观察值的平均水平或集中趋势，是描 
述定量数据的一种最常用的方法。均数计算有直接法和加权法。 

(一）直接法 

将所有的观察值不，石，…，足直接相加再除以观察例数，写成公式为 

(2-0 

式中， f 表示样本均数; E 是希腊字母(读作 sigma), 表示求和的符号;《为样本观察例数。如对 
例 2-1 的数据用上面公式计算，可算得140名正常成年男子红细胞数的均值为 
j 4.76+5.26+ 5.61 +•••+5.02+4.76 


140 


= 4.776( x 10 ,2 /L) 



(二） 加权法 

加权法是根据频数表计算均数的一种方法。当观察例数较多时，资料通常要分组编成频数 
表，对已经编成频数表的资料不能再用公式 (2-1) 计算，这种情况下我们可以把各组的组中值视 
为各组观察值的代表值，分别乘以各组的频数得到各组观察值之和，然后将它们相加得到观察 
值的总和再除以总例数。用公式表示为 

/A+/A + … (2-2) 

式中 A 表示频数表的组 段数; /,/ 2 ,…，/*及： c, ,々，， x* 分别表示1至 A: 组的频数及组中值，见 
表 2-2 第 ( 3 ) 栏和第 (2) 栏; 组中值 =( 本组段下限+本组段上限 )/2 ,如 “4.00 〜”组段的组中值为 
(4.00 + 4.20)/2 =4.10, 余类推。 

将表 2-2 的数据代人公式 (2-2), 有 

2x3.90 + 6x4.10 + 11x4.30+ … + 2x5.70 + 1x5.90 = 4 ?g4 ( xl0 ,2 /L) 

HO 

由此可见,在样本例数较多的情况下，加权法与直接法算得的结果相差不大。 

(三） 均数的应用 

均数的意义容易理解，而且结果也比较稳定，因而应用极为广泛。但是它主要适用于对称 
分布或偏度不大的资料，尤其适合正态分布资料。由于在计算均数时用到了每一个观察值，在 
偏态较大的情况下，算出的均值容易受到频数分布尾端极大或极小值的影响，不能真正地反映 
分布的集中位置,这时应考虑改用其他方法 。 

二、几何均数 

医学研究中有一类比较特殊的资料，如抗体滴度、细菌计数、血清凝集效价、某些物质浓度 
等，其数据特点是观察值间按倍数关系变化，对此可以计算几何均数 (geometric mean) 以描述其 
平均水平。几何均数用 G 表示，计算公式为 

G = " y ] X , X 2 - X n (2- 3 ) 

即 将;! 个观察值连乘后开„次方。为了计算方便，常改用对数的形式计算，即 

G _ le -'pg^i + | g^2 + - + lg^j_ lE -^j^£.j (2-4) 

可以看出，几何均数相当于各观察值对数的均值再取反对数。对于频数表资料，若用/，/ 2 ,…， 
/»及々,^,...,^分别表示1至 A 组的频数及各组中位取值，则几何均数为 

G -l g -i^ 1 g- t .- t -/2 1 B^ + … +/ t ) 一 lg -i(2-5) 

例 2-2 测得10个人的血清滴度的倒数分别为2, 2,4, 4, 8, 8, 8, 8,32,32,求平均滴度。 
如果计算均数,其值为歹= 10.8 ,现计算几何均数为： 

^,_ lE - l pg2 + lg2 + lg4+lg4+lg8 + lg8+lg8 + lg8+lg32 + lg3^j^ 7 

显然在这里均数不能代表其平均水平，选择几何均数则比较合适。故10份血清滴度的平均水 
平为1:7。 

例 2-3 某医师使用胎盘浸出液钩端螺旋体菌苗对326名农民接种2个月后测得血清 IgG 
抗体滴度见表 2-3 ,试计算平均抗体滴度。 
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表 2-3 胎盘浸出液钩端螺旋体菌苗接种2个月后血清 IgG 抗体滴度 



即胎盘浸出液钩端螺旋体菌苗接种2个月后血清 IgG 抗体的平均滴度为1:139。 

几何均数在医学研究领域多用于血清学和微生物学中。有些明显呈偏态分布的资料经过 | 
对数变换后呈对称分布，也可以采用几何均数描述其平均水平，但要注意观察值中不能有0或 | 
负数，否则在作对数变换之前需要加一个常数。同一组观察值的几何均数总是小于它的算术 
均数。 

三、中位数和百分位数 

(-) 中位数 

将一组观察值从小到大按顺序排列 … （ x „， 居中心位置的数值即为中位数 (median)， 
记为 M。 当观察 例数” 为奇数时，中位数是按顺序排列在第 （n + 1 )/2 项的观 察值； 当观察例 
数为偶数时，则中位数是按顺序排列在第《/2项和第(《/2)+ 1项之间，即该两项的平均值。在 
全部观察值中有半数的值比 M 大，另有半数的值比 M 小。例如，现测得5个人的极低密度脂 
蛋白 （VLDL) 中的载脂 B 蛋白的含量 (mmol/L) 分别为0.0095、0.0322、 0.06 17、0.0970、 0.1 085， 
中位数等于 0.0617mmol/L; 若仅测暈了四个值 0.0095 、 0.0322 、 0.0617 、0.0970,则中位数为 
(0.0322 + 0.0617)/2 = 0.0470( mmol^ ) 0 另外也可以根据频数表资料计算中位数。下面通过实例 
说明它的计算方法。 

例 2-4 对某地630名50〜60岁的正常女性检査了血清 甘油三 酯含量 （ romo i / L )， 资料如 
表2>4所示,试计算其中位数。 

表 2*4 某地630名正常女性血清甘油 三酯含量( mmol/L )的频数表 






m 
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计算频数分布中位数的第一步是确定它所在区间的位置。资料总例数是630,其50%是 
315,当观察值按顺序排列时，第315个观察值就是中位数 M (近似计算)。从累积频数分布可以 
看岀，第315个观察值处于 [ 0.70, 1.00) 区间内，第 (4) 栏的累积频率则更清楚地显示了它所在 
的区间。假定该区间内的观察值呈均匀分布，因为在此区间之前有196例，在区间内共有167 
例，所以可以推想，中位数位于该区间内离下限的距离为该区间宽度的 （315-196)/167 处。为 
了得出中位数的值，可将 (315- 196)/167 乘以区间宽度0.30,再将此乘积项加到所属区间的下 
限上去(参见图2-2)。于 是有： 

M = 0.70+ 630x05 - 196 x 0.30 = 0.914 (mmol/L) 

167 

—般,可用以下公式计算中位数 

M = L+^ 5n ~f^i M (2-6) 

式中,I为 M 所在组段的下限，心为组距,义为频数 ,/ t 为之前各组段的累积频数。 



图 2-2 中位数计算方法示意图 


(二）百施数 

中位数可以用来描述一组观察值的中心位置。但有时我们还需要了解数据分布的其他位 
置，如资料分布的左侧占全部观察值25%的位置，这时可以通过计算百分位数 (percentile) 确 
定。百分位数用符号 巧表示，: c 表示百分位,所谓百分位数 A 是指在一组数据中找到这样一个 
值，全部观察值的 x% 小于 p x ， 其余 (100-x)% 大于巧。如匕表示资料在尸 25 位置左侧的累积 
频数占总数的25%，右侧占 75% 。 i> 5D 实际就是中位数 M。 百分位数的计算原理与中位数完全 
相同，对式 (2-6) 只需将中位数换成任意百分位数，即 



| 式中，I为 A 所在组段的下限，4为组距 ，/ x 为频数，人 为& 所在组段之前各组段的累积频数。 

需要 注意： 根据频数表数据计算出的百分位数&是近似值，实际计算中可以由计算机直接 
I根据原始数据求出其准确值。 

例 2-5 计算例 2-4 的百分位数 P25 、p 75 、 P90 。 

利用公式(2-7)，可分别 求得： 

P 25 = 0.40 + — 0x0,25-27 x 0.30 = 0.632 (mraol/L) 

169 

笔记.V I P 75 = 1.30+ ㉝ x0 . 75 一 x 0.30=1.357 (mmol/L) 

81 
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P K = 1.60+ 630 X 090 ~ 538 x 0.30 = 1.807 (mmol/L) 

90 42 

(三）中位数和百分位数的应用 

1. 中位数与均数、几何均数的作用相同，都能用来反映一组数据的集中趋势或平均 水平。 
由于中位数的确定仅取决于它在数据序列中的位置，而不是由全部观察值综合计算得出，因 
此不受少数特大或特小值的影响，在这一点上它优于均数。一般来说，在频数分布呈明显偏 
态或频数分布的两端无确定数值时，使用中位数描述集中趋势或平均水平较为合理。当变量 
呈对称分布时，理论上中位数和均数相同。但对于样本资料，由于计算均数时利用了所有的 
观察值，所以较中位数稳定。另外，中位数还有一个很大的缺点，即不便于作统计运算，如根 
据两组资料的不同中位数无法算出合并的中位数。因此在统计分析中，中位数不如均数应用 
广泛。 

2. 百分位数可以用来描述资料的观察值序列在某百分位置的水平，中位数是其中的一个 
特例。多个百分位数结合使用常可以用来说明某一特定的问题，如用和 As 描述资料的分 
散程度，用/> 2 . 5 和/规定医学95%的参考值 范围； 在研究青少年生长发育时用百分位数 (&, 
/>25,尸75, 户 》) 划分等级等。百分位数可用于任何频数分布的资料，但靠近两端的百分位数仅在 
样本例数较大时才比较稳定(如》> 100)。 

第三节变异程度的统计指标 

实际中，除要了解观察值的平均水平外，往往还需要同时了解这些观察值之间的变异程度 
或偏离集中位置的程度。为了说明这一问题,看下面的例子。 

例 2-6 对甲乙两名高血压患者连续观察5天，测得的收缩压分别 如下： 

甲患者 (mmHg) 162 145 178 142 186 (J, = 162.6) 

乙患者 (mmHg) 164 160 163 159 166 (7 乙 =162.4) 

从列出的数据可以看出，两人收缩压的均数几乎没有差别，但甲患者的血压波动比较大， 
而乙患者相对比较 稳定。 因此，描述一组观察值，除需要表示其平均水平外，还要说明它的变 
异情况。 

衡量变异程度大小的指标有多种，但大体可以分为 两类： 一类是按间距计算，有极差和四 
分位数 间距； 另一类则按平均差距计算，有方差、标准差和变异系数等。 

一 .极 差 

极差 (range) 也称作全距，即观察值中最大值和最小值之差，用符号表示，是变异指标中 
最简单的一种。极差大说明变异程度大，反之说明变异程度小，如例 2-6 中甲乙两患者收缩压 
的极差分别为 

/?ip= 186 - 142 = 44( mmHg) 

/?z.= 166-159=7(mmHg) 

可见甲患者收缩压的波动大，乙患者波动小。 

极差的方法虽然简单，但在某些场合颇有实用价值，如用于说明传染病、食物中毒等的最 
短、最长潜伏期等。用极差说明数据分布的离散程度，简单明了、容易使用，但由于计算时仅用 
到了最大值和最小值，而没有利用观察值中的全部信息，随着观察例数的增多，抽到较大或较 
小数值的可能性越来越大，极差也会随之而变大，尤其当资料呈明显偏态分布时会显得更加不 
稳定，所以极差通常仅用于粗略地说明变量的波动范围。 
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二、四分位数间距 

极差不稳定主要受观察值中两端极端数值的影响，如果将两端的数据去掉一定的比例，所得 
到的结果就会比较稳定。一种方法是把所有的观察值排序后，分成四个数目相等的段落，每个段 
落的观察值数目各占总例数的25%,去掉两端的25%,取中间50%观察值的数据范围即为四分 
位数间距 (quartile range)。 四分位数间距用符号表示，它可以通过计算百分位数 P 75 和之差 
得封，即 Q = P ”- P 加 例如由上一节例24算出， 50-60 岁正常女性血清甘油三酯含量的百分位 
数心和 的位置分别为 0.632mm o l/L 和 1.357mm 0 l/L, Q = 1 .357 -0.632=0.725( mmoML), 说明有 
50%的女性甘油三酯在 0.632mmol/L 和 1.357mm 0 l/L 之间，其四分位数间距为 0.725nun O l/L。 四 
分位数间距越大,说明数据的变异越大；反之，四分位数间距越小说明变异越小。 

用四分位数间距作为说明个体差异的指标，与极差相比不易受极端值的影响，但仍未用到 
每一个具体的观察值，在统计分析中应用不够普遍。 

三，方 差 

为了利用每一个观察值的信息，可以计算各观察值偏离平均数的平均差距，为了避免正负 
抵消，将每个观察值与均数之差的绝对值相加，然后取平均，即计算-1|/«,这是一个很 
直观的变异量度，但由于用了绝对值,在数学上不便于处理。为此可以通过取平方来避免正负 
抵消，即使用方差 (variance) 衡量数据的变异程度，其计算公式为 

(2-8) 

n -\ 

其中，分子 [Of-J) 2 称为离均差平方和 ( sum of squares), 它描述了每个观测值相对于集中位 
置无的分散程度。通过推导可化为下式 

^ oc - xy ^ x 2 - (2-9) 

式 (2-8) 的分母1称为自由度 (degree of freedom, 简写为#)，它表示在所有的《个离均差平方 
项中，由于样本均数歹的限制，只有 《-1 个离均差平方和是独立的。 f 为样本方差(总体方差 
用 o 2 表示),其值越大说明数据的变异越大。 

四、标准差 

方差是用取平方后的单位来表示的，如果血压的原始数据用毫米汞柱表示，则方差就是毫 
米汞柱的平方。在统计分析中为了方便，通常将方差取平方根，还原成与原始观察值单位相同 
的变异量度，其计算公式为 

(2-10) 

S 称为标准差 (standard deviation), 有时也记为 SD。 显然，一组观察值的标准差越大说明其 
变异程度越大。将式中的离均差平方和展开，标准差也可写为 



例如对于例 2-6 有 

甲 患者： 162+145 +178 +142+186 = 813 

162 2 +145 2 + 178 2 + 142 2 +186 2 =133713 
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9 



表 2-5 140名正常成年男子红细胞计数 (x 10 12 /L )的标准差计算表 


;~红细胞计数 
(11 

组中值 U} 
(2) 

频数 (f} 

(3) 

fx 

(4) 

fit 2 

(5) 

3.80- 

3.90 

2 

7.80 

30.42 

4.00- 

4.10 

6 

24.60 

100.86 

4.20- 

4.30 

11 

47.30 

203.39 

4.40- 

4.50 

25 

112.50 

506.25 

4.60- 

4.70 

32 

150.40 

706.88 

4.80- 

4.90 

27 

132.30 

648.27 

5.00- 

5.10 

17 

86.70 

442.17 

5.20- 

5.30 

13 

68.90 

365.17 

5.40- 

5.50 

4 

22.00 

121.00 

5.60- 

5.70 

2 

11.40 

64.98 

5.80-6.00 

5.90 

1 

5.90 

34.81 

合计 
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669.80 

3224.20 


由公式 (2-12) 得出， 

卽 io ，⑴ 


即所求标准差为 0.38xlO^L。 

在变异指标中，标准差或方差是其他变异指标所不能比拟的。标准差能够直接用于代数运 
算，如根据来自同一总体的几个样本的标准差，可以直接求得合并样本的标准差，而不必根据 
合并样本重新 计算。 更为重要的是，标准差与正态分布有明确的关系，它与均数结合能够完整 
地概括一个正态分布。 


五.变异系数 

标准差与原始数据的量纲相同，在两组数据的均数相差不大、单位相同时，从标准差的大 
小就可以直接比较两个样本的变异 程度。 但是，有时我们需要对均数相差较大或单位不同的几 
组观察值的变异程度进行比较，这时使用标准差就不再适宜。在这种情况下可以使用变异系数 
(coefficient of variation, 简记为 CV ), 其计算公式为 
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CV = -= xlOO°/o (2-13) 

例 2-8 测得某地成年人舒张压的均数为 77.5mmHg, 标准差为 10.7mmHg ; 收缩压的均数为 
122.9 m mHg， 标准差为 17.1nunHg。 试比较舒张压和收缩压的变异程度。 

舒张压和收缩压是两个不同的指标，尽管单位相同，但均数相差较大，如直接比较两个标 
准差，会得出收缩压变异较大的结论。现计算两者的变异系数 

舒张压 CF=i^xi00%= 13.81% 

收缩压 CV = \229 >< 1°° % = 13 . 910/o 

可见两种指标的变异程度几乎没有什么差别。 


一、单项选择题 

1. 某医学资料数据大的一端没有确定数值，描述其集中趋势适用的统计指标是（ 


B. 几何均数 
D. P 95 百分位数 


B. 能充分利用数据的信息 
D. 更适用于偏态分布资料 


A. 中位数 
C. 均数 
E. 频数分布 

2- 算术均数与中位数相比，其特点是 （ 

A. 不易受极端值的影响 
C- 抽样误差较大 
E. 更适用于分布不明确资料 

3 - 将一组计量资料整理成频数表的主要目的是 （ ) 

A. 化为计数资料 B. 便于计算 

C. 提供原始数据 D. 为能够更精确地检验 

E. 描述数据的分布特征 

4 - 6 人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1 : 8()、1:80、1:160、1:3■，求 
平均滴度应选用的指标是 （） 


A. 均数 
C. 中位数 
E. 倒数的均数 

5. 变异系数主要用于 （) 

A. 比较不同计量指标的变异程度 
C 衡量测量的准确度 
E. 衡量样本抽样误差的大小 

6. 对于正态或近似正态分布的资料，描述其变异程度应选用的指标是 （ 

A. 变异系数 B. 离均差平方和 

C 极差 D. 四分位数间距 

E. 标准差 


B. 几何均数 
D. 百分位数 


B. 衡量正态分布的变异程度 
D. 衡量偏态分布的变异程度 
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7. 已知动脉硬化患者栽脂蛋白 B 的含量 (mg/dl) 呈明显偏态分布，描述其个体差异的统计 
指标应使用 （） 

A. 全距 B. 标准差 

C. 变异系数 D. 方差 

E. 四分位数间距 

8. —组原始数据的分布呈正偏态分布，其数据的特点是 （） 

A. 数值离散度大 B.' 数值离散度小 

C. 数值偏向较大的方向 D. 数值偏向较小的方向 

E. 数值分布不均匀 

9. 对于正偏态分布总体，其均数与中位数的关系是 （） 

A. 均数与中位数相同 B. 均数大于中位数 

C . 均数小于中位数 D. 两者有一定的数量关系 

E. 两者的数量关系不定 

10. 在衡量数据的变异度时，标准差与方差相比，其主要特点是（ ） 

A. 标准差小于方差 B. 标准差大于方差 

C. 标准差更容易计算 D. 标准差更为准确 

E. 标准差的计量单位与原始数据相同 

二、计算与分析 

1. 现测得10名乳腺癌患者化疗后血液尿素氮的含量 （mmol/L) 分别为 3.43,2.96, 
4.43, 3.03, 4.53, 5 25, 5.64, 3.82,4.28, 5.25, 试计算其均数和中位数。 

2. 某地100例30~ 4() 岁健康男子血清总胆固醇值 ( m g/dl) 测定结果如下： 

202 165 199 234 200 213 155 168 189 170 188 168 184 147 219 174 130 183 178 174 
228 156 171 199 185 195 230 232 191 210 195 165 178 172 124 150 211 177 184 149 
159 149 160 142 210 142 185 146 223 176 241 164 197 174 172 189 174 173 205 224 
221 184 177 161 192 181 175 178 172 136 222 113 161 131 170 138 248 153 165 182 
234 161 169 221 147 209 207 164 147 210 182 183 206 209 201 149 174 253 252 156 

(1) 编制频数分布表并画出直 方图； 

(2) 根据频数表计算均值和中位数，并说明用哪一个指标比较合适； 

(3) 计算百分位数 A 、尸 25 、尸 75 、 

3. 测得10名肝癌病人与名正常人的血清乙型肝炎表面抗原 （HBsAg) 滴度如下表， 
试分别计算它们的平均滴度 - 

肝癌病人与正常人的血清乙肝表面抗原 （HBsAg) 滴度 
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4. 下表为10例垂体催乳素微腺瘤的病人手术前后的血催乳素浓度，试说明用何种指 
标比较手术前后数据的变异情况较为合适。 

手术前后患者血催乳素浓度 

病例号 

血催乳素浓度 (ng/ml) 


术前 

术后 

1 

276 

41 

2 

880 

110 

3 

1600 

280 

4 

324 

61 

5 

398 

105 

6 

266 

43 

7 

500 

25 

8 

1760 

300 

9 

500 

215 

10 

220 

92 



一 


(李康侯艳） 


笔记 
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正态分布是自然界中最常见、最重要的一种连续型分布，是后面将要学习的各种统计推断 
方法的理论基础。在医学中，有很多生理生化指标服从或近似服从正态分布，如同性别健康成 
年人的身高、体重，红细胞计数和血红蛋白含量等。在变量服从正态分布情况下，可以很容易 
地确定其数值岀现在任意指定范围内的概率，特别是可以应用于医学参考值范围的估计。 

第一节正态分布 

正态分布 （normal distribution) 首先由德国数学家和天文学家德•莫阿弗尔 （A.de Moiver, 
1667— 1754) 于1733年提出。德国数学家高斯 (Gauss， 1777 — 1855) 虽然发现稍晚，但他迅速将 
正态分布应用于天文学，并对其性质作了进一步的研究，使正态分布的应用价值广为人知，因 
此，正态分布又称为高斯分布 (Gaussian distribution )。 

一、正态曲线 

医学研究中许多变量的频数分布以均数为中心，表现为越接近均数频数分布越多，离均数 
越远频数分布越少，且左右两侧基本对称。由第二章图 2-1 可见，140名正常成年男子红细胞 
计数的频数分布就是以均数为中心，左 
右基本对称的。若将图 2-1 的纵轴由表 
2-2 中的频数转换为频率，即可得到140 
名正常成年男子红细胞计数的频率分布 
图（图 3-1), 虽然两个图的纵坐标含义 
各异，但图的形状却完全相同。可以设 
想，随着观察人数的逐渐增多，组段不 
断细分，图 3-1 中的直条将逐渐变窄，其 
顶端中点连线越来越近似一条均匀连 
续的光滑曲线（图3-2)。图 3-2 中曲线 
的横轴表示测量指标尤，纵轴表示概率 
密度函数 （probability density function) 

和从分别表 
示第/ 组的频数和组 距，” 表示总例数， 

则图中各直条的面积恰好等于各自组段 
的频率(純//)=/；/«)。在例数较大的 
情况下频率可近似地看作概率，曲线下 
概率的总和等于1。若概率密度曲线表 
现为中间高，两边低，左右对称，略呈钟 
形，则近似于数学上的正态曲线 (mrnnal 
curve), 在处理资料时，可把它看作是正 
态分布。 


° 3.8 4.2 4.6 5.0 5.4 5.8 

红细胞计数 (xlO u /L> 

图 3-1 频率分布图示意图 



图 3-2 概率密度曲线示意图 




二、 iE 态分布的特征 


如果随机变量尤的分布服从概率密度函数 



和概率分布函数 


(-00<尤<+00) 



(-oo<Ar<+°°) 


(3-1) 


(3-2) 


称连续型随机 变量尤 服从正态分布，记为 AV (//， 沪)，式中 7 T 和6是两个常数，分别为圆周率 
( tt =3.141 592…… ） 和自然对数的底值 ( e 近似等于 2.71828),^ 和 a 为正态分布的两个参数，其 
中//为尤的总体均数 ，作X 的总体方差，义的取值范围理论上没有边界 ( _°° < ^ <+ °° ) ，/离# 
越远，函数/尤)值越接近于0,但不会等于0。 

正态分布具有如下几个主要特征： 

1. 正态分布是单峰分布，以 AT =// 为中心，左右完全对称，正态曲线以义轴为渐近线，两端 
与/轴不相交。 

2. 正态曲线在尤=//处有最大值，其值为 /(;/) = l / Ori ); 义越远离值越小，在 
处有拐点，呈现为钟形。 

3. 正态分布完全由两个参数#和 (7 决定,//是位置参数，描述正态分布的平均水平，决定着 
正态曲线在 X 轴上的 位置; a 是形状参数，描述正态分布的变异程度，决定着正态曲线的分布形 
状。若 〃固定 而改变//，曲线沿着 X 轴平行移动， 

其形状不变，改变的只是位置（图 3-3); 若//固定 
而改变〜 (7 越大曲线越“矮胖”，表示数据越分散 
即变异越大， a 越小曲线越“瘦高”，表示数据越集 
中即变异越小（图3-4)。因此，不同的//与不同的 
戊对应不同的正态分布。 图 3-3 正态分布位置参数变化示意图（^= 1 ) 




图 3-4 正态分布形状参数变化示意图(// = 0) 


4. 正态曲线下的面积分布有一定的规律。①曲线下的面积即为概率，可通过式 （3-2) 求 
得，服从正态分布的随机变量在某一区间上的曲线下面积与该随机变量在同一区间上的概率相 
等（图 3-5); ②曲线下的总面积为1或100%,以//为中心左右两侧面积各占50%,越靠近"处曲 
线下面积越大，两边逐渐 减少； ③所有正态曲线，在 A / 左右的任意个标准差范围内面积相 同：区 
间芦士 a 范围内的面积约为68.27%,区间芦± 1.64 a 范围内的面积约为90.00%,区间"土 1.96 a 范 
围内的面积约为95.00%,区间#±2.5詣范围内的面积约为99.00%(图3-6)。 



第三章正态分布与医学参考值范围 


:■ 



X' n Xi 

图 3-5 正态曲线下面积示意图 



图 3-6 正态曲线下面积的分布规律示意图 


三、标准正态分布 


正态分布由两个参数 A 和 t 确定，对任意一个服从分布的随机变量经式 (3-3) 
变换都可转换为# = 0、 (7= 1的标准正态分布 (Standard normal distribution), 即 

z = ^- (3-3) 

式 (3-3) 变换，也称随机变量的标准化变换 (standardized transformation) Q z 的概率密度函数为 

(-c»<2<+oo) (3-4) 

分布函数为 


0(Z) = 



(― pp<Z<+oo) 


(3-5) 


实际应用中，经 z 变换可把求解任意一个正态分布曲线下面积的问题,转化成标准正态分 
布曲线下相应的面积问题(标准正态分布曲线下面积关系如图 3-7 所示)。附表1给岀了标准正 
态分布曲线下 z 值左侧尾部面积，利用标准正态分布可求出原始变量/在任意区间的概率值。 
由于标准正态分布曲线以0为中心左右两侧完全对称，故表中只列出了 z 值的负数部分，当 
z>0 时可以使用式 (3-6) 计算 

^(z)=\-0{-z) (3-6) 



图 3-7 标准正态分布曲线下面积示意图 


2 在区间 (z,，z 2 ) 上的概率(曲线下的面积)计算公式为 

尸 (z, <z<2,) = <2>(z 2 ) - 0(z,) (3-7) 

当"和未知时，可以利用样本均数歹和标准差 S 计算 z. 即 
_ X-X 

Z J~~ 


(3-8) 


笔记 
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例 3-1 若 A ■〜 M//, 沪),试计算X取值在区间 1.96 ff 上的概率。 

先做标准化变换，求叉所对应的 z 值，根据式 (3-3) 计算 

= - 1 - "一 1.96 

^ = ^ = (^ 1 . 96 ? )-^ =196 

通过査附表1,由式 (3-6) 和式 (3-7) 可得 

P (- 1.96<z<1.96)=0( 1.96) -少 (-1.96 )=(1 -少 (-1.96)) -少(_1.96) 


=1 - 2少 (-1.96 )= 1 _ 2 x 0.025 = 0.95 


即义取值在区间 p±1.96<r 上的概率为95%。同理，/即尤取值在区间 
#±2.58(7 上的概率为99%。对于正态分布而言， 1.96 和 2.58 这两个数值经常会用到。 

例 3-2 已知某地140名正常成年男子红细胞计数近似服从正态分布， Y=4.78 x 10 12 /L, 
5=0.38 x 10 12 /L, 试 估计： ①该地正常成年男子红细胞计数在 4.0 x 10 ,2 /L 以下者占该地正常成 
年男子总数的百 分比； ②红细胞计数在 4.0 x 10 ,2 /L~5.5 x 10 ,2 /L 者占该地正常成年男子总数的 
百分比。 

求红细胞计数在某个范围内的人数占总人数的比例，即是求此区间内正态曲线下的面积 
问题。 

(1) 将义 =4.0 代人式 (3-8) 得 



于是问题转化成了求标准正态分布 z 值小于 -2.05 的概率，查附表1得步 (-2.05 )=0.0202,表明 
该地成年男子红细胞计数低于4 x 10 I2 /L 者约占该地正常成年男子总数的 2 . 02% 。 

(2) 分别计算不 =4.0 和 羌 =5.5 所对应的 z 值 

P( 4.00 <^r< 5.50 )= p ( 4Q ^~^ 78 <^^< 5 ' 5 ^~^'—)=^~ 205<z<189) 

0.38 a U.jo 

=(1 -® (-1.89 ) )- 0(. -2.05 )=( 1 - 0.0294 )- 0.0202 = 0.9504 
表明红细胞计数在 4.0 x 10' 2 /L~5.5x 10 12 /L 者约占该地正常成年男子总数的95.04%。 


第二节医学参考值范围 

一、 医学参考值范围的概念 

所谓医学参考值范围 (medical reference range ), 是指“正常”人的解剖、生理、^化指标等数 
据大多数个体值的波动范围。由于存在生物个体变异，虽然都是“正常”人，但指标的测量值也 
会有所不同，即使是同一个体的数据，也会随环境.时间等变化而改变，因此不能以某一个测量 
数据作为标准，而必须确定一个波动范围。医学参考值范围的确切含义是，从选择的参照总体 
中获得的所有个体观察值,用统计学方法建立百分位数界限，由此得到个体观察值的波动区间》 
通常情况，使用的是95%参考值范围。 

确定医学参考值范围主要有两方面的 意义： 一是基于临床实践,从个体角度，作为临床上判 
定正常与异常的参考标准，即用于划分界限或分类，如成年人的白细胞计数一般以 （4.0~10.0)x 
10 9 /L 作为医学参考值范围；二是基于预防医学实践，从人群角度，可用来评价儿童的发育水平， 

I如制订不同年龄、不同性别儿童某项发育指标的等级标准。 





第三章正态分布与医学参考值范围 q m 

制订医学参考值范围的注意事项 

1. 确定同质的参照总体一般选择“正常”人，但需要注意的是，所谓正常不是指机体任何 j 
器官、组织的形态和机能都正常的人，而是指符合特定健康本平的人，绝对健康是不存在的，在 
每个人身上都可能存在着某种程度的病理状态，在使用或制定临床参考值范围时，“正常人”的 
健康水平应有明确的界定，主要是排除了对研究指标有影响的疾病或有关因素的同质人群。例 
如，制订血清谷丙转氨酶 (SGPT) 参考值范围，“正常”人的条 件是: ①无肝、肾、心、脑、肌肉等疾 | 

患； ②近期未服用对肝脏有损伤的药物(如铒丙嗪，异烟肼 等); ③检测前未做剧烈运动。此外， j 
在划分同质对象时,要注意地区、民族、性别、年龄、时间、妊娠等因素对指标的影响，例如红细 
胞计数及血红蛋白含量，男女各异，高原居民与平原居民不同。 

2. 选择足够例数的参照样本参照样本含量的确定没有统一的规则，它与总体分布有关， 

若接近正态分布，变异度又不是很大，需要的样本含量就可以少 一些； 反之,若明显偏态或数据 
比较分散，需要的样本含量就相应地多一些。通常情况下，确定参考值范围需要大样本，如果I 
例数过少,确定的参考值范围往往不够准确。 

3. 控制检测误差为保证原始数据可靠，检测过程中要严格控制随机误差，避免系统误差 
和过失误差。一些受主观因素影响的指标，对测定的方法、分析仪器的灵敏度、试剂的纯度、操 
作的熟练程度等要尽可能做到标准化,对测量环境和条件有统一的规定和说明，且要尽量与应 
用医学参考值范围时的实际情况一致。如临床检验中应对收集样本的环境和生理条件(温度、 

季节、体育活动强度、饮食、妊娠等),收集、转运和储藏样品的方法及时间有明确的规定，可通 
过人员培训、控制检测条件、重复测定等措施，严格控制检测误差。 

4. 选择单、双侧界值应依据专业知识确定是采用单侧还是双侧界值，即决定取单侧范围 
还是双侧范围值。例如，白细胞计数无论过高或过低均属异常，其参考值范围需分别确定下限 
和上限，即采用双侧 界值； 有些指标仅过大或过小为异常，如肺活量仅过低异常，血铅仅过高异 
常，只需确定下限或上限，即采用单侧界值。 

5. 选择适当的百分数范围参考值范围是指绝大多数"正常”人(参照总体)测量值的所在 
范围。所谓的“绝大多数”究竟是多少，应结合专业知识，根据研究目的、研究指标的性质、数 
据分布特征等情况综合考虑百分数范围的选择，可以取80%、90%、95%或99%等，其中以95% | 

最为常用。实际应用中最好结合“正常”人和病人的数据分布特点（图 3-8 和图 3-9), 权衡假阳 j 
性率和假阴性率，选择适当的百分数范围。若“正常”人与病人数据分布重叠较多，为避免较大 
的假阳性和假阴性错误率，有时还需确定可疑值范围。可疑值范围不宜过大，只要包括交叉重 
叠的主要部分即可，或根据研究目的以减小误诊率(假阳性率)或漏诊率(假阴性率)来选择，临 
床诊断试验中常用 ROC 曲线进行综合判定。如研究的主要目的是减少假阳性(用于确诊病人 



上限值 上限值 


图 3-8 两组人群的数据分布无重叠示意图 图 3-9 两组人群的数据分布有重叠示意图 



第三章正态分布与医学参考值范围 


或选定科研病例)，参考值范围的百分数范围要取大一些(如95%或99%)；如研究的主要目的 
是减少假阴性(用于初筛病人),参考值范围的百分数范围可小一些(如90%或80%)。 

6. 选择计算参考值范围的方法根据资料的分布类型，样本含量的多少和研究目的等，选 
用适当的方法确定参考值范围。近似服从正态分布或转换为正态分布的资料，可选用正态近似 
法； 不服从正态分布的资料，可选用百分位数法或曲线拟合法等进行计算。 

三、医学参考值范围的计算方法 


计算参考值范围的方法有多种，其中最基本的有正态分布法和百分位数法。表 3-1 给出了 
两种方法90%、95%和99%百分数范围的计算公式。两种方法比较，百分位数法适合于任何分 
布类型的资料，故在实际中最为常用，但由于参考值范围所涉及的常常是波动较大的两端数据， 
使用百分位数法必须要有较大的样本含量，否则结果不 稳定； 正态分布法要求资料必须服从或 
近似服从正态分布，优点是结果较稳定，在样本含量不是很大的情况下仍然能够进行处理，缺 
点是适用范围较窄，不适合偏态分布资料。如偏态分布资料经变量变换(取对数、倒数等）能够 
转换为正态分布或近似正态分布，依然可用正态分布法计算参考值范围。 


概率 

(%) 

90 

95 


表 3-1 医学参考值范围的正态分布法和百分位数法计算公式 


双侧 

X±\.64S 

X±l.96S 

X±2.5^S 


正态分布法 _ 

单侧 

下限 上限 

^-1.285 X+1.2SS 

X- 1.645 J+1.64S 

X-2.33S X+2.33S 


双侧 


P-rPos 


百分位数法 _ 

单侧 

下限 上限 

尸 10 Poo 


Pp^P^ _ 


1. 正态分布法对服从正态分布的指标，可根据正态曲线下面积的分布规律进行参1值 
范围的计算，具体步 骤为： ①对资料进行正态性 检验； ②若资料服从正态分布，需计算均数7与 
标准差 A ③按式 (3-9) 计算参考值范围。 


(双侧)，歹+2„5或 Y— zA 单侧） 


(3-9) 


例 3-3 已知某地140名正常成年男子红细胞计数近似服从正态分布， 1=4.78 x 10 ,2 /L, 
5=0.38 xio 12 /L, 试估计该地正常成年男子红细胞计数的95%参考值范围。 

近似正态分布资料可按正态分布法处理，因红细胞计数值过大或过小均为异常，故应估计 


双侧95%参考值 范围： 


X± z 005/2 <S=4.78± 1.96x0.38 =(4.04, 5.52) 

即该地正常成年男子红细胞计数的95%参考值范围为 4.04x lOWL 〜 5.52x 10 I2 /U 

例 3-4 某年某地测得100名正常成年人的血铅含量 （Mg/ 出）如下，试确定该地正常成年人 
血铅含量的95%参考值范围。 



根据经验已知正常成年人的血铅含量近似对数正态分布，因此酋先对原始数据作对数变 
换，经正态性检验 n 了知对数值服从 小:态 分布(/>>0.50)，故编制对数值频数表（表 3-2), 再利用小: 
态分布法求95%参考值范围。 
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表 3-2 某年某地100名正常成年人血铅含量( pg/dl) 对数值频数表 


依据表 3-2, 设X为对数组段的组中值，, 7 = 1⑻， [//= 120, [/义 2 = 149.73,则对数值的均 
数和标准 差为： 



S = = ^ 14 9.73 - = 0.2406 (^g/dl) 

因为血铅含量仅过大异常，故参考值范围应为单侧，求单侧95%上 限值： 

lg' , (J+1.645)=lg- , (1.2 + 1.64 x 0.2406) = 39.3 173 (ng/dl) 

即该地正常成年人血铅含量95%参考值范围为小于 39.3173ng/dl。 

2. 百分位数法当分析指标例数《较大时分布趋于稳定，若不满足正态分布可采用百分位 
数法计算参考值范围。 

例 3-5 依据表2~4某地630名 50-60 岁正常女性血清 甘油三 酯含量 (mmol/L) 的资料，估计 
其血清 甘油二 •酯含量的单侧95%参考值范围，为该地 50-60 岁女性高血脂诊断与治疗提供参考 
依据。 

本资料显现出血清甘油二•酯含量数值偏小的人数较多，呈正偏态分布，故选用百分位数法 
计算参考值范围，依据专业知识，为该地50〜60岁女性高血脂诊断与治疗提供参考依据应计算 
单侧95%界值/^。 

P 95 = 1 -90+( 630 x 95% -580 )/28 x 0.30 = 2.098( mmol/L) 

即该地 50-60 岁正常女性血清甘油三酯含量的单侧95%参考值范围为小于 2.098mmol/L。 

许多统计方法都要求资料服从正态分布或近似正态分布，在使用这些方法之前需对资料进 
行正态性判定，尤其是在样本含量较小时，对各组数据要分别予以考察。如有充足的专业知识 
和经验得知某些医学指标 ( 身高、体重、血常规检测指标等)服从正态分布，或样本含量足够大时， 
可不必再作正态性判定。正态性判定的方法有 两类： 一是图示法，图示法简单易行但比较粗糙， 
依据对频数表和直方图的目测或绘制概率-概率图 (prohahility-prohahility plot，P-P plot) 和分位 
数-分位数图 (quantile-quantile plot, Q-Q plot), 可粗略了解观察资料是否服从正态分布；二是计算 
法，即通过计算反映正态分布特征的指标对观察资料是否服从正态分布做出推断，常采用矩法、 
妒检验和 Z) 检验等正态性检验方法，对此可利用统计软件获得计算结果。 
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练习题 


_、单项选择题 

1. 正态曲线下，横轴上从均数到+~的面积 为（ ） 

A. 50% B. 95% C. 97.5% D. 99% 

E. 不能确定（与标准差的大小有关） 

2. 标准正态分布的形状参数和位置参数分别为（ ） 

A. 0,1 B. 1,0 C. 卩 ，(7 D. E. S t X 

3. 正态分布的均数、中位数和几何均数之间的关系为（ ） 

A. 均数与几何均数相等 B. 均数与中位数相等 

C. 中位数与几何均数相等 D. 均数、中位数、几何均数均不相等 

E. 均数、中位数、几何均数均相等 

4. 正常成年男子的红细胞计数近似服从正态分布，已知歹 =4.78 xl0 12 /L ， •5=0.38 xl0 12 /L ， 
2 =(4.00-4.78) /0.38= -2.05 ,1 - 步 (z)=1 -少 (-2.05 )=0.9798,则理论上红细胞计数为（ ) 

A. 高于 4.78 x 10 ,2 /L 的成年男子占97.98% 

B. 低于 4.78 x 10 ,2 /L 的成年男子占97.98% 

C •高于 4.00 x 10 12 /L 的成年男子占97.98% 

D. 低于 4.00 x 10 12 /L 的成年男子占97.98% 

E •在 4.00 x 10 12 /L 至 4.78 X 10 12 /L 的成年男子占97.98% 

5. 某项指标 9 5%医学参考值范围表示的是 （) 

A. 在此范围“异常”的概率大于或等于95% 

B. 在此范围“正常”的概率大于或等于95% 

C. 在“异常”总体中有95%的人在此范围之外 

D. 在“正常”总体中有95%的人在此范围 

E. 在人群中检测指标有5%的可能超出此范围 

6 - 确定某项指标的医学参考值范围时，“正常人”指的是 （） 

A. 从未患过疾病的人 B. 患过疾病但不影响研究指标的人 

C. 排除了患过某种疾病的人 D. 排除了影响研究指标的疾病或因素的人 

E. 健康状况良好的人 

1 - 某人群某项生化指标的医学参考值范围，该指标指的是（ ） 

A. 在所有人中的波动范围 B. 在所有正常人中的波动范围 

C. 在绝大部分正常人中的波动范围 D. 在少部分正常人中的波动范围 

E. 在一个人不同时间的波动范围 

8_要评价某地区一名5岁男孩的身高是否偏高，其统计学方法是 （） 

A. 用均数来评价 B. 用中位数来评价 

C. 用几何均数来评价 D. 用变异系数来评价 

E. 用参考值范围来评价 

9. 应用百分位数法计算参考值范围的条件是 （） 

A. 数据服从正态分布 B. 数据服从偏态分布 

€• 声大样本数据 D. 数据服从对称分布 

E. 数据变异不能太大 
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10. 某市1974年238名居民的发汞含量 （Jimol/kg) 如下，则该地居民发汞值的95%医学参 
考值范围是 （） 

发隶值 （Hmol/kg) 15〜 35〜 55 - 75 - 95 〜 115〜135 - 155 〜 175〜 195-215 

人数 _20 66 60 48 18 16 6 1 0_3 

A. <P 95 B. >P 5 

c. (P 2 . s ,Po7.s) D. 歹 +1.965 

E. <X + 1.64S 
计算分析题 

1. 已知健康男童的体重近似服从正态分布，某年某地 150 名 12 岁健康男童体重的均 
数 Y= 36 . 3 kg, 标准差 .S=6.19kg, 试 估计： ①该地12岁健康男童体重在 50kg 以上者占该地 
12岁健康男童总数的百 分比； ②该地12岁健康男童体重在 30~40kg 者占该地12岁健康男 
童总数的百 分比； ③该地⑹％的12岁健康男童体重集中在哪个 范围； ④估计该地12岁健 
康男童体重的95%参考值范围，： 

2. 某地 2 00例正常成年人血铅含量 （nmol/L) 的频数分布如下，试估计该地正常成年 
人血铅含量的95%参考值范围 


血铅含 S(Hmol/L) 0- 0.24 - 0.48 〜 0.72 - 0.96 - 1.20- 1.44 - 1.68 - 1.92 - 2.16 - 2.40- 

频数 _7 49 45 32 28 13 14 4 4 12 


2.64- 

1 
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在医学研究中，除了前述的定量数据，还有如阴性和阳性、有效和无效、治愈和未治愈、死 
亡和生存以及各种疾病分类等类型的定性数据。对这些数据的整理往往是先将研究对象按其 
性质或特征分类，再分别计数每一类的例数。描述定性数据的数据特征，通常需要计算相对数。 
根据不同的研究目的，常用率、构成比、相对比等指标来进行统计描述。 

第一节常用相对数 


相对数 (relative number) 是两个有关的绝对数之比,也可以是两个有关联统计指标之比。相 
对数的性质取决于其分子和分母的意义，不同类型的相对数具有不同的性质。计算相对数的 
意义主要是把基数化作相等，便于相互比较。例如，某病用 A 法治疗100人，其中75人有效， 
B 法治疗150人，100人有效，若仅比较两组有效的绝对人数是不恰当的，而通过分别计算有效 
率 7 5/100x 100%=75%与100/150 x 100% = 66.7%来比较两法的疗效才有实际意义。常用的相 
对数指标有率、构成比和相对比。 


率 (mte ) 表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比，说明某现 
象出现的强度或频率，通常以百分率(％)、千分率(％„)、万分率 （！/ 万）、或十万分率 （1/10 万)等 
来表示。计算公式为 


率= 


某事物或现象发生的实际数 


比例基数 


(4-1) 


某事物或现象发生的所有可能数 
公式中的“比例基数”通常依据习惯而定，如治愈率、感染率用百分率，出生率、死亡率用千分 
率，某些疾病的死亡率用十万分率。总体率用疋来表示，样本率用 P 来表示。需要注意的是， 
率在更多情况下是一个具有时间概念的指标，即用于说明在一段时间内某现象发生的强度或频 
率，如出生率、死亡率、发病率等,这些指标通常是指在1年时间内发生的频率。 

例 4-1 某单位在2009年有3128名职工，该单位每年对职工进行体检，在这一年新发生髙 
JfiUl 病人12例，则 

高血压发病率 = 1000% o = 3.84%o 


3128 

二构成 


比 


构成比 =• 


(4-2) 


构成比 (proportion) 表示某事物内部各组成部分在整体中所占的比重，常以百分数表示，计 
算公式为 

该事物内部某一组成部分的观察单位数(例数） „ 1(j| 

一 某事物内部的所有观察单位之和(例数之和） X 
例 4-2 某医院某月住院病人数及死亡人数如表 4-1 所示，其中第(4>列为构成比，是由第 
(3) 列数据计算而得。第 (5) 列为率，是由第 (2) 与第 (3) 列数据计算而得。 

由表 4-1 中的第 (4) 与第 (5) 列可看出，构成比和率虽然同是相对数，但却是两种不同的概 
念，应用的场合不同，应特别注意。构成比之和应为100%,某一构成部分的增减会影响其他构 
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表 4-1 某医疗机构某月住院病人数及死亡人数统计 


~疾病类型 病人数 

(1) _ (2) 

呼吸系统疾病 620~ 

循环系统疾病 1030 

消化系统疾病 540 

恶性肿瘤 _300 

合 2490 


病死人数 死亡构成（％) 病死率 （％o) 

(3) _ (4) _ (5) 

25 23^1 40.32 

35 33.33 33.98 

20 19.05 37.04 

_25_23£1_ 83.33 

105 100.00 42.17 


成部分相应的减少或 增加； 而某一部分率的变化并不影响其他部分率的变化，且其平均率不能 1 
简单地将各率相加后平均求得。这里需要注意的是，死因构成比只能说明某病死亡人数在总死 
亡人数中所占比重，如果需要描述其致死的严重程度，则要计算病死率。 


相对比 (relative ratio) 是 A、B 两个有关联指标值之比，用以描述两者的对比水平，说明 A 是 
B 的若干倍或百分之几，通常用倍数或百分数表示。这两个指标可以性质相同，如不同时期的 
患病人数之比，也可以性质不同，如体重与身高的平方之比(体重指数， BMI)。 其计算公式为 


tfc+K 


1. 两类别例数之比如我国2010年人口普查的男性人口数为686852572人，女性人口数 
为652 872 280人，则 

686 852 572 


男女性别比 =- 


= 1.052 


652 872 280 

即男性人口数是女性的 1.052 倍。 

2. 相对危险度 (relative risk, 简记为 RR) 是流行病学前瞻性研究中常用的指标，表示在两 j 
种不同条件下某疾病发生的概率之比，反映暴露组发病或死亡的危险是非暴露组的多少倍，说！ 
明疾病与暴露之间的关联强度。其计算公式为 

狀=胥 (4-4) 

其中尸,为暴露组的发病率或患病率，心为非暴露组的发病率或患病率。 

例 4-3 某地区非吸烟女性饮酒者和不饮酒者的肺癌发病资料如表 4-2 所示，试计算其相 
对危险度。 


表 4-2 某地区非吸烟女性饮酒者和不饮酒者的肺癌发病资料 


饮酒与否 

发病数 

观察人年数 

发病率 （1/10 万人年） 

是 


12 965.2 

46.3 

否 

660291.4 

40.1 

相对危险度为 


说明该地区非吸烟女性饮酒者的肺癌发病率是非吸烟女性不饮酒者的 1.15 倍。 

3. 比数比 (odds ratio, 简记为 07?) 常用于流行病学中病例-对照研究资料，表示病例组和 
对照组中的暴露比例与非暴露比例的比值之比，是反映疾病勺暴露之间关联强度的指标。其计 
算公式为 
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(4-5) 


^~P 0 /(1-P 0 ) 

其中巧 为病例组的暴露比例，户。为对照组的暴露比例。另外, A 也可定义为在暴露状态下的发 
病率, P。 为在非暴露状态下的发病率,两种定义的计算结果完全相同。 

例 4-4 母亲围孕期是否有发热或感冒病史与婴儿神经血管畸形关系的病例对照研究的资 
料如表 4-3 所示，试计算母亲围孕期是否有发热或感冒病史引起婴儿神经血管畸形的比数比。 

表 4-3 母亲围孕期是否有发热或感冒病史与婴儿神经血管畸形的关系 


无 

合计 


40(a) 

112(c) 




病例组中的暴露比例与非暴露比例分别为 

/}=— 1- 
a + c 1 

对照组的暴露比例与非暴露比例分别为 


P 0 : 


b + d’ 


由公式 (4-5) 可以得岀 


_ Pj/d-Pj) [aUfl + c)] / [c/(a + c)] ad 
— P 0 /(l-P 0 )~ [b/(b+d)]/[d/(b+d)] = ~b^ 


o/j = 40 x 203 = 363 
20x112 

即母亲围孕期是否有发热或感冒病史引起婴儿神经血管畸形的优势比为 3.63 倍。 

四、标准化率 

在比较两个不同人群的患病率、发病率、死亡率等资料时，为消除其内部构成(如年龄、性 
另 IJ 、工龄、病程长短、病情轻重等 ) 对率的影响，可以使用标准化率 (standardized rate )。 

例 4-5 甲、乙两医院治愈率比较的资料如表 4-4 所示。 

___ 表 4-4 甲 、乙两医院治愈率的比较_ 

甲医院 乙医院 

_入院人数 治愈人数 治愈率(％) 入院人数 ^人数 治愈率（％) 


合计 


从表4_ 4 可以看出，对于任何一科室，甲医院的治愈率均高于乙医院，但甲医院的总治愈率 
却低于乙医院，这种偏差源于两医院科室内部构成不同，即甲医院内科人数较多而导致总治愈 
率偏低。若将两医院治愈率直接进行比较，结果显然是不合理的。为了正确比较两医院治愈率 
的大小，统计学上常用标准化的方法来消除内部构成的影响，即先将两医院科室的构成按照统 
一的标准进行校正，计算出校正的标准化治愈率后再进行比较。 








常用的标准化法包括直接标准化法和间接标准化法，根据已有资料的实际情况，可以采用 
其中一种方法。本节仅介绍常用的直接法。 

1. 标准化直接法的计算公式为 

p . N t P l+ N 2 Pw + N k P k (4.7) 

N N 

式中厂为标准化率，况 ，… N k 为某一影响因素(如病型、年龄等)标准构成的每层例数， A , 
尸 2 ，…，巧为原始数据中各层的率， W 为标准构成的总例数。上式也可写成 

+ C 2 P 2 + -+C k P k (4-8) 

式中， G=iVi/AT 为标准构成比。 

2. 标准构成的选取标准化法计算的关键是选择统一的标准构成，选取标准构成的方法 
通常有下面 三种： 

( 1 ) 选取有代表性的、较稳定的、数量较大的人群构成为标准构成，如全国范围或全省范围 
的数据作为标准 构成； 

(2) 选择用于比较的各组例数合计作为标准 构成； 

(3) 从比较的各组中任选其一作为标准构成。 

例 4-6 试对表 4-4 资料计算甲乙两个医院的标准化率。 

将比较各组的各层例数的合计作为标准构成，即将两医院各科室的人数之和作为标准构 
成，根据两医院各层的治愈率，计算两医院各层的预期治愈数，最后得到两组标准化后的预期 
治愈数’其计算结果如表 4-5 所示。 

表 4-5 消除构成影响后两医院治愈率的比较 

mm 标准构成 甲医院 乙医院 ~~~ 

_ 人数 原治 愈率(% ) 预期 治愈^数 原治愈率(％) 预期治愈数 

SS 2000 65^0 1300 63^0 1260 

外科 2000 94.0 1880 91.0 1820 

传染病科 1000_9^0_950__ 9Z0 _920 

合计 5000 4130 4000 


按公式 (4-7) 计算得到甲医院标准化后的总治愈率为 

户’甲 = 5000 X 100%=82.6% 

乙医院标准化后的总治愈率为 

尸乙 = x 100%=80.0% 

由上可见，甲医院标准化后的总治愈率高于乙医院标准化后的总治愈率。需要注意：标准 
化率只代表相互比较的各组间的相对水平，而不能反映实际 情况； 另外，选用的标准不同，得到 
的标准化率可能不同。 


第二节医学中常用的相对数指标 

一、死亡统计指标 

1. 死亡率 (mortality rate) 又称粗死亡率 (crude death rate), 表示某年某地每千人口中的死 
亡人数，反映当地居民总的死亡水平，计算公式为 
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死亡率‘ 


(4-9) 


某年某地死亡人口总数 .. 

= 同年该地年平均人口数 X 

计算死亡率时需注意分母必须是与分子相对应的人口，同年平均人口等于年初人口和年末 
人口的平均值，在实际工作中，常以计算平均人口数，表示某一年的人口数量水平。一般情况 
下，老人和婴儿的死亡率较高，男性的死亡率高于女性。因此，对不同地区的死亡率进行比较 
时，应注意不同地区人口年龄或性别构成的影响，若年龄或性别构成存在差异，需先将死亡率 
标化后再进行 比较。 

2. 年龄别死亡率 (age-specific death rate) 表示某年某地每千人口中的死亡数，它消除了人 
口年龄构成不同对死亡水平的影响，计算公式为 

某年某地某年龄组死亡人数 
: 同年该地同年龄别平均人口藪 

3. 死因别死亡率 ( cause specific death rate) 表示某年某地每 10 万人中因某种疾病死亡的 
人数，它反映各类病伤死亡对居民生命的危害程度，是死因分析的重要指标，计算公式为 

某年某地某病死亡人数 ~ 

' 同年该地平均人口数 X 

4. 死因构成 (proportion of dying of a specific cause) 也称相对死亡比，指全部死亡人数中， 
死于某死因者占总死亡数的百分比，反映各种死因的相对重要性，计算公式为 

因某种死因死亡的人 数 、/ 

总死亡人数 X 


年龄别死亡率= 


某病死亡率 =■ 


5x100 000/10万 


某种死因的构成比 =- 


(4-10) 


(4-11) 


(4-12) 


二、疾病统计指标 

1 . 发病率 (incidence rate ) 表示在一定期间内，一定人群中某病新发生的病例岀现的频率， 
是反映疾病对人群健康影响和描述疾病分布状态的一项测量 指标。 其计算公式为 


某病发 病率: 


某时期某病新病例数 


(4-13) 


拒会发生该病的 
入分母内。 


可能患该病的人 ( 如已接种疫苗有效者 ) 不应计算人分 

2. 患病率 (prevalence rate) 也称现患率，表示某一时点某人群中患某病的频率，通常用来 
表示病程较长的慢性病的发生或流行情况，计算公式为 


某病患病率: 


某地某时点某病患病例数 


比例基数 


(4-14) 


' 该地同期内平均人口数 
以上比例基数可为100%、1000%«、10000/万、100000/10万，应根据流行病学的专业要求决定。 
实际中患病率的分母通常为调查的总人数，分子为患病的人数。 

3. 病死率 (case fatality rate) 表示某期间内，某病患者中因该病死亡的频率，表明该疾病 
的严重程度和医疗水平等，多用于急性传染病，计算公式为 

某期间因某病死亡人数 。 

~同期该病的患病人数 X 

4. 治愈率 (cure rate ) 表示接受治疗的病人中治愈的频率，计算公式为 
治愈病人数 


某病病死率= 3 


x 100% 


(4-15) 


治愈率= 


接受治疗病人数 


(4-16) 
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第三节相对数指标使用的注意问题 

1. 不要把构成比与率相混淆构成比只能说明某事物内部各组成部分的比重和分布，不 
能说明该事物某一部分发生的强度与频率。如表 4-1 ，从第 (4) 列的构成可看出循环系统疾病的 
病死人数占全院病死人数的比例最大，但从第 (5) 列各类疾病的病死率来看，恶性肿瘤的病死 
率最高，它反映了各类疾病死亡危险性的大小。 

2. 使用相对数时分母不宜过小分母过小时相对数不稳定。如使用某药物堉疗5例病人 
中4例有效，计算有效率为80%，若3例有效，则有效率为60%,虽然只有1例的变化，但是波 
动幅度较大。因此，在观察例数较小时，最好直接用绝对数表示，以免引起误解。 

3. 注意资料的可比性在比较相对数时，用以比较的资料应是同质的，即除了要比较的处 
理因素外，其他条件应尽量相同或相近。对不同时期、地区、条件下的资料进行比较时应注意 
观察对象、研究方法、观察时间等是否齐同，尤其对于不同时期的资料应考虑客观条件是否相 
同。同时还应观察待比较组间的资料内部构成是否相同，如两组间年龄等构成不同，可分别比 
较各年龄别的率或者对总率进行标准化后再比较。 

4. 样本率或构成比存在抽样误差对样本率或构成比进行比较时，由于存在抽样误差，不 
能单凭数字表面相差的大小而下结论，应对各组的样本率或构成比的差别作假设检验(参见第 
九章)。 


— 、单项选择题 

1. 如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命，则应发生的情况 
是（ ） 

A. 该病患病率增加 
C. 该病的发病率增加 
E. 该疾病的死因构成比增加 

2. 计算乙肝疫苗接种后血清学检查的阳转率，分母为（ 


B. 该病患病率减少 
D. 该病的发病率减少 


B. 平均人口数 
D. 乙肝患者人数 


B. 减少死亡率估计的抽样误差 
D. 消除各地区内部构成不同的影响 


A. 乙肝易感人数 
G. 乙肝疫苗接种人数 
E. 乙肝疫苗接种后的阳转人数 

3. 计算标准化死亡率的目的是 （） 

A. 减少死亡率估计的偏倚 
C. 便于进行不同地区死亡率的比较 
E. 便于进行不同时间死亡率的比较 

4. 已知男性的钩虫感染率高于女性，今欲比较甲乙两乡居民的钩虫感染率，但甲乡女性居 
多，而乙乡男性居多，适当的比较方法是 （） 

A. 两个率直接比较 B. 两个率间接比较 

c. 直接对感染人数进行比较 a 计算标准化率比较 

E. 不具备可比性 

§，甲县恶性肿瘤粗死亡率比乙县高，经标准化后甲县恶性肿瘤标化死亡率比乙县低，其原 
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因最有可能是 （） 

A. 甲县的诊断水平高 

B. 甲县的肿瘤防治工作比乙县好 

C. 甲县的人口健康水平高 

D. 甲县的老年人口在总人口中所占比例更小 

E. 甲县的老年人口在总人口中所占比例更大 

6. 相对危险度灿的计算方法是 （） 

A. 两个标准化率之比 B. 两种不同疾病的发病人数之比 

C. 两种不同疾病患病率之比 D. 两种不同疾病发病率之比 

E. 两种不同条件下某疾病发生的概率之比 

7. 比数比0及值表示的是 （） 

-A. 两个标准化率的差别大小 B. 两种不同疾病的发病率差别程度 

C. 两种不同疾病患病率差别程度 D. 两种不同疾病的严重程度 

E. 两种不同条件下某疾病发生的危险性程度 

8. 计算患病率时的平均人口数的计算方法是 （） 

A. 年初人口数和年末人口数的平均值 B. 全年年初的人口数 

C. 全年年末的人口数 D. 生活满一年的总人口数 

E. 生活至少在半年以上的总人口数 

9- 死因构成比反映的是 （） 

A. 各种疾病发生的严重程度 
C. 疾病在人群的分布情况 
E. 各种疾病的死亡风险大小 

10- 患病率与发病率的区别是 （） 

A. 患病率高于发病率 
C- 计算患病率不包括新发病例 
E. 患病率与病程有关 

二、计算与分析 

1- 为了解某单位职工冠心病的患病情况，对全体职工进行体检后发现，在该单位 
1 2 90名职工中，患冠心病的有 305 人，其中女性 no 人，占36%，男性I 95 人，占64%,因此 
认为男性易患冠心病，这种结论是否正确？为什么？ 

2. 在“锑剂短程疗法治疗血吸虫病病例的临床分析”一文中，根据下表资料认为“其 
中，卜岁组死亡率最高，其次为20 -岁 组”，问这种说法是否正确？ 


锑剂治疗血吸虫不同性别死亡者年龄分布 


B. 疾病发生的主要原因 
D. 各种死因的相对重要性 


B. 患病率低于发病率 
D. 发病率更容易获得 







3. 某市对其某区的各型病毒性肝炎的疫情资料进行分析结果如下表所示，发现1998 
年与2007年相比，甲肝、乙肝和未分型病毒性肝炎的构成比均有所下降，而丙肝和戌肝的 
构成比则呈上升趋势，尤其以丙肝的构成比上升最明显。若据此得出“乙肝发病率下降， 
丙肝发病率上升”的结论，是否正确？请陈述理由。 

某市某区1998年和2007年病毒性肝炎发病情况 


4. 现有两个煤矿的工人尘肺患病率（％)如下表所示，试比较两个煤矿的工人尘肺总 
的患病率。 

两个煤矿的工人尘肺患病率情况(％ ) 

""" 工龄 甲矿 ‘ 2 矿 :‘ ' 

《年）""检查人数 尘肺人数 患病率卜/^ 检查'人数 尘肺人数 患病率(％「 


5. 现有甲乙两地某月居民的粗死亡率资料如下表所示，试比较两地死亡率水平高低。 
甲乙两地某月粗死亡率比较 


人口数 死亡率(％。） 死亡数 


人口数 死亡率 (％o) 


(马駿） 
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统计表和统计图是统计描述的重要工具。在统计工作的整个过程中，从实验设计或调査设 
' 计开始，直到最后分析总结，为突出数据的说服力，都要用统计表和统计图进行描述，尤其在科 
I 研论文中，表达统计结果及进行对比分析时，应用更为广泛。目前统计表和统计图的制作主要 
使用统计软件，因此本章对有关手工制作的方法不作介绍。 

第一节统计表 

统计表 (statistical table )是把统计资料和结果用表格的形式进行表达，其目的是简洁、清晰、 
!直观，方便对比和阅读。统计表有基本的制作要求，并不是把数据放到表格里就形成统计表。 
I同时也要注意，不是所有的数据都需要制作统计表，应该有选择性地对重点要表达的数据制作 
统计表。 

一、 统计表的编制原则和结构 


㈠统计表的编制原则 

1. 重点突出，简单明了，即一张表一般只表达一个中心内容和一个主题。若内容过多，可 
分别制成若干张表。 

2. 主谓分明，层次清楚。统计表虽然是表格的形式，但其内涵代表的是若干完整的文字语 
句，因此，主谓语的位置要准确。一般来说，定语部分放在标题内，主语放在表的左边作为横标 
目，谓语放在右边作为纵标目，横标目与纵标目交叉的格子放置数据，从左向右读，每一行便形 
成一个完整的句子。标目的安排及分组要层次清楚，符合逻辑，便于分析比较。 

3. 数据表达规范，文字和线条尽量 从简。 

(二）统计表的结构 

从外形上看，统计表可由标题、标目（包括横标目、纵标目 ） 、线条、数字和备注5部分构成， 
见表5-1。 


组别 

例数 

有效例数 

无效例数 

有效 率(％) 

对照组 

103 

17 

86 

16.51 

试验组 

_105 

74 

31 

70.48 

合计 

_208 

91 

U 7 

43.75 


1. 标题它是统计表的总名称，放在表的上方中间位置，简明扼要地说明表的主要内容， 
包括时间、地点和研究内容。表的标题非常重要，内容既不能过于简单，又不要过于繁复，尽 
可能一言切中所要表达的目的和内容。若有多张表格，标题前应加上标号，以方便引用，如“表 
5-1” 所示。如果表中所有数据指标的度量衡单位一致，可以将其放在标题后面，放于括号内。 

2. 标目用来说明表内数据含义的文字。横标目位于表的左侧，说明各行数据的意义，如 
表 5-2 中“医院1”，“医院2” 等，纵标目位于表头右侧，如表 5-2 中“例数”、“有效例数”、“有效率 
(%)”等。纵标目的总标目主要是对纵标目内容的概括，在需要时才设置，如表 5-2 中的“对照组 
( 安慰剂 )” 、“试验组”。标目要尽可能简单、明了，指标的单位要标示清楚，统计学符号的 使用声 
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3. 线条撰写论文的统计表一般采用“三线表”的格式，即一张表格以三条线为基础，根据 
内容需要在表内可以适当附加1~2条细线。表的顶线和底线把表的主要内容与标题分隔开，中 
间一条线把纵标目与数据分隔开，不宜使用竖线和斜线。如果某些标目或数据需要分层表示， 
可用短横线分隔(见表5-2)。 

4. 数字用阿拉伯数字表示，位数对齐，小数位数一致。表内不留空格，无数字用“-”表 
示，缺失数字用“…”表示，最好以备注的形式说明。若数字是“0”，则填写“0”。 

5. 备注表中数据区一般不插入文字或其他说明，需要说明时可用“ *” 号标出，将说明文 
字写在表格的下面。 


二统计表的种类 

根据标目的层次复杂程度，统计表可以分成简单表和复合表。 

1 . 简单表简单表的标目只有一个层次，主语按一个标志排列，一般用作横标目，而纵标 
目为统计指标名称，见表5-1。每一行可用一个完整的句子表达，如第一行可读为“对照组试验 
的例数为103例，其中有效例数为17例，无效例数为86例，有效率为16.50%”；第二行可以读 
为“试验组的例数为10 5 例，其中有效例数为74例，无效例数为31例,有效率为*70.48%”。 

2. 复合表复合表的标目有两个以上层次，即主语按多个标志排列。复合表有两个或三 
个分组标志，一般把其中主要的或分项较多的一个作为横标目，而其余的则安排在纵标目与总 
标目上。如表 5-2 中，将试验的各医院和两种不同治疗结合起来分组，可以表达不同医院、不同 
处理组别的有效率,从两个不同方面进行分析和对比。 


表 5-2 试验药物与安慰剂治疗帕金森病的多中心临床试验结果 




对照组(安慰剂） 



试验组 


隨 — 


有效例数 

有效率(％) ~ 


有效例数 

有效率(％) 

医院1 

36 

6 

16.67 

36 

27 

75.00 

医院2 

31 

4 

12.90 

34 

22 

64.71 

医院3 

36 

7 

19.44 

35 

25 

71.43 

合计 ~ 

103 

17 

16.50 

105 

74 

70.48 


二、编制统计表的注意事项 

统计表只要满足编制原则、结构合理、能够清晰地表达数据结果即可，实际应用中应注意 
以下几方面的问题。 

1. 统计表不一定是唯一的，同一数据经过标目重排或分解组合，可以根据需要构造不同形 
式的统计表，表中标目位置的安排最不易把握，通常将要比较的主体放在表格最左边，右边则 
是相应的统计学指标和实验数据,左右两者位置不宜颠倒，但有时也要视具体情况决定。例如， 
表 5-3 和表 5-4 给出的是治疗高血压的临床试验中患者在治疗前的舒张压和收缩压的情况，使 
用的是两种不同的表格。表 5-3 是一个比较规范的统计表，从逻辑上看比较的主体是试验组和 
对照组，通过舒张压和收缩压的测量值了解两组是否有所不同；而表 5-4 中标目的位置看似有 
些问题，但如果列表的主要目的不是比较试验组和对照组，重点是要体现不同指标的测量值， 
尤其指标比较多、标目横向难以排放时，就应该采用这种格式。 

2. 避免内容混杂，表达不清，结构混乱。若标目层次多于三个以上，统计表就会变得繁冗， 
因此尽量少用。 
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分组 


试验组 

对照组 


表 5-3 试验组和对照组血压的基线情况 （ 1 ) 

~~ 舒张压 ( mmHg) 收缩压 ( mmHg) 

例数 X±S M X±S M~ 

61 98.64 ±4.73 98.0 150.56± 11.42 149.0 

_62_ 98.31 土 5.29 _96^_ 148.23 士 12.43 _ 146.0 


表5^4试验组和对照组血压的基线情况 （2) 

^ 试验组 ( ^=61) 对照组 (n 2 = 62 ) ~~ 

- ^ ^±S M X±S M~ 

舒张压 (mmHg) 98.64 ±4.73 98.0 98.31 ±5.29 96.0 

收缩压 ( mmHg) 150.56 士 11.42 _ 149.0 _ 148.23 ±12.43 _ 146.0 


例 5-1 某地某年111例钩端螺旋体病患者发病季节、年龄和职业构成资料如表 5-5 所示， 
请按照编制统计表的基本要求，检查此表编制是否合适，如不合适，加以修改。 


8月上旬 

一人数 | % 

H _ _ L 6.3 


15以下 

1 o/o 

—12 1 10.8 


农民 

a^~T % 

~106 1 95.5 1 


表 5-5 流行病学有关的主要因素(原表） 
季节 — 


8月中旬 I 8月下旬 


人数 | % 人数 | % 

70 1 63.1 I 28 1 25.2 


年龄(岁） 

15 - _ 

人数 I 

95 1 85.6 


学生 

人数 1 %" 

1 1 0.9 


萌业 

待业青年 

— 人数 1 %— 

3 1 2.7 




9月+旬 

人数 I %~ 
6 1 5.4 


45以上 


人数 I %~ 

1 1 0.9 


表 5-5 的缺 点是： ①标题不够明确，而且未注明时间、 地点； ②发病季节、年龄和职业三项 
指标无可比性，放在一起，内容 繁杂; ③标目设计不合理，“人数多次重复，不便于分析对 
比;④表内文字和线条过多。因此可以将其修改成表5-6、表 5-7 和表 5-8 三个表。 


表 5-6 某地某年钩端螺旋体病患者发病季节分布 ( 修改表） 


季节 

人数 

构成比（％) 


8月上旬 

8月中旬 

8月下旬 

9月上旬 
合计 

7 

70 

28 

6 

6.3 

63.1 

25.2 

5.4 


111 

100.0 


表 5-7 某地某年钩端螺旋体病患者发病年龄分布(修改表} 


年&「岁） 

人数 

构成比（％) 


15以下 

12 

10.8 
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表 5-8 某地某年钩端螺旋体病患者发病职业分布(修改表) _ 

职业 人数 构成比（％) 

农民 106 

学生 1 

待业青年 3 

其他 1 _ 

甜 _ 111— 


例 5-2 某医院用麦芽根糖浆治疗急慢性肝炎患者161例，疗效资料见表5-9,指出其缺点 
并加以改进。 


表 5-9 麦芽根糖浆治疗急慢性肝炎疗效观察(原表） 


\效果 

有效 



小计 

近期痊愈 

好转 

无效 

总例数\ 

例 I % 

m I % 


例 | % 


108 | 67.1 

70 | 43.5 

38 23.6 

53 | 32.9 

此表的主要目的是表达用麦芽根糖浆治疗急慢性肝炎的疗效情况，但是其标题过于简单， 

主谓安排不合理，标目组合重复。可进行如下修改，见表5-10。 



表 5-10 某年某医院麦芽根糖浆治疗急慢性肝炎的疗效观察(修改表 } 


疗效 

例数 

构成比（％) 


无效 

53 


32.9 


好转 

38 


23.6 

近期痊愈 

70 


43.5 



161 


100.0 



第二节统计图 


统计图 （statistical chart) 是把数据资料以图示的形式表达，使数据对比更加形象、直观 、一 
目了然。统计图利用点的位置、曲线的变化、直条的长短和面积的大小等几何图形来表达统计 
资料和指标，它将研究对象的特征、内部构成、相互关系、对比情况、频数分布等情况形象而生 
动地表达出来，直观地反映出事物间的数量关系，更易于比较和理解。 

一、统计图的制作 


(一） 统计图的制作原则 

1. 必须根据资料的性质、分析目的选用适当的统计图，由于统计图不能精确地显示数据大 
小,所以经常需要与统计表一起使用。 

2 - 一个图通常只表达一个中心内容和一个主题，即一个统计指标。 

3. 绘制图形应注意准确、美观，图线粗细适当，定点准确，不同事物用不同线条(实线、虚 
线、点线 ) 或颜色表示，给人以清晰的印象。 

(二） 统计图的结构 

统计图通常由标题、图域、标目、图例和刻度5个部分组成。 

1. 标题其作用是简明扼要地说明资料的内容、时间和地点 ，一 般位于图的下方中央位置 




并编号，便于引用和说明。 

| 2. 图域即制图空间，除圆图外 ，一 般用直角坐标系第一象限的位置表示图域，或者用长 

I方形的框架表示。 

3. 标目分为纵标目和横标目，表示纵轴和横轴数字刻度的意义，一般有度量衡单位。 

4. 图例对图中不同颜色或图案代表的指标注释。图例通常放在横标目与标题之间，如 
果图域部分有较大空间，也可以放在图域中。 

5. 刻度即纵袖与横轴上的坐标。刻度可在内侧或外侧，刻度数值按从小到大的顺序，纵轴 
由下向上，横轴由左向右。绘图时按照统计指标数值的大小，适当选择坐标原点和刻度的间隔。 

(三）统计图的种类 

医学中常用的统计图有直条图、百分条图、圆图、普通线图、半对数线图、直方图、箱式图、 
j 误差条图和散点 图等； 还有一些特殊的统计图，如表达多个试验中心研究结果的森林图、生存 
分析中的生存曲线图、聚类分析的树形图等。一般应根据资料的性质和分析目的选择适当的图 
形。以下仅介绍医学中常用的统计图。 

二、描述定量数据的统计图 

(― ) 直方图 

直方图 (histogram) 用直条矩形面积代表各组频数,各矩形面积总和代表频数的总和。它主 
要用于表示连续变量频数分布情况，如根据频数表 5-11 绘制成频数分布图5-1。从图 5-1 可以 
看出，该市3岁女孩身高主要分布在 92cm 左右，位于 84-lOOcm 之间者约占总数的95%。为了 
j 对比两组的频数分布情况，也可以根据表 5-12 将两个直方图用图 5-2 —张图表示。结果显示， 
糖尿病患者的糖化血红蛋白 （HbAlc) 水平明显高于正常人，而且可以明显看出两组人糖化血红 
蛋白含量数值分布的差异。 


86 - 
88- 
90- 


92 - 


表 5-11 某市某年150名3岁女孩身高的频数分布 


10 

19 

23 

26 


98~ 

100- 

102- 

104-106 


一频数 

24 

17 

10 
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图 5-2 糖尿病患者和正常对照 HbA1c(%) 的频数分布 


绘制直方图时应 注意： 纵轴的刻度必须从 “0” 开始，而横轴的刻度按实际范围制定；各矩形 
的高度为频数或频率，宽度为组距。如果各组段的组距不同要调整各矩形的高，矩形高度=组 
段频数/组距。 

(二）线图 

线图 (line chart) 是用线段的升降来表示指标(变量)的连续变化情况，适用于描述一个变量 
随另一个变量变化的趋势。通常纵坐标是统计指标，横坐标是时间变量。普通线图的坐标都按 
算术尺度标记刻度，若纵坐标按对数尺度(通常采用常用对数),横坐标按算术尺度，制作的线 
图为半对数线图( semi-logarithmic linear chart )。如根据表 5-13 绘制成的图 5-3 为普通线图。 


表 5-13 某地1968—1974年男女结核病死亡率 


年份 

死亡率 

年份 

死亡率 （1/10 

_ 

男 

女 

男 一 


1968 

50.19 

37.54 | 

1972 

35.59 

24.08 

1969 

42.97 

25.00 ! 

1973 

38.31 

24.10 

1970 

45.37 

27.88 1 

1974 

25.29 

16.00 

1971_ 

44.42 

25.10 || 



_ _ 


笔记 
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1968 1969 1970 1971 1972 1973 1974 

年份 

图 5-3 某地1968—1974年结核病死亡率 

对于相对数指标，用普通线图有时难以准确表达和对比不同变量的变化速度，这时可以使 
用半对数线图。如将表 5-14 的数据绘制成普通线图（图 5-4), 呈现出白喉死亡率比伤寒、副伤 
寒死亡率下降速 度快； 如果绘制成半对数线图（图 5-5), 则白喉死亡率与伤寒、副伤寒死亡率变 
化快慢速度相差不大。 


表 5-14 某地 1949—1958 年白喉，伤寒、副伤寒的死亡率 


fe 1949—1 
白喉 


1/10 7?) 




年份 

图 5-4 某地1949 一 1958年白喉、伤寒、副伤寒死亡率线图 

绘制线图时应 注意： 横轴代表分组标志，纵轴代表统计 指标； 横轴和纵轴的刻度都可以不 
从“0” 开始； 用短线依次将相邻各点连接即得线图，不应将折线描成光滑曲线。线图中若只有 
一条折线，称为单式 线图； 若有两条及以上的线条，称为复式线图。在绘图时，需要注意纵横轴 
比例，比例不同，给人的印象也不同。 
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m 



图 5-5 某地 1949-1958 年白喉、伤寒、副伤寒死亡率半对数线图 


(三）箱式图 

箱式图 （box plot) 用于比较两组或多组资料的集中趋势和离散趋势，主要适用于描述偏态 
分布的资料。箱式图的中间横线表示中位数，箱体的长度表示四分位数间距， W«43-5'J®P75 
和 Pm 。 最外面两端连线有两种表示方法：一种是表示最大值和最小值；另一种是去除离群值 
后的最大值和最小值，对离群值另作标记。离群值可定义为大于 +1.52 或小于 ^-1-52. 
g 为四分位数间距。显然箱体越长表示数据离散程度 越大； 中间横线若在箱体中心位置，表示 
数据分布对称，中间横线偏离箱子正中心越远，表示数据分布越偏离中位数。箱式图的纵轴起 
点不一定从 “0” 开始。根据表 5-15 绘制成的图 5-6 可以看出，大白鼠肝肿瘤中递甲氨酶的活度 
( CPM ) 明显高于正常肝中递甲氨酶的活度，而且数据的变异性很大，并有1个离群值。 



表&15大白鼠正常肝和肝肿瘤中递甲氨酶 ( CPM ) 的活度 


肿瘤肝 | _ 正常肝 

227 91 

339 35 

130 68 

592 15 

405_6_ 
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(四）误差条图 

误差条图 （error bare) 用于比较多组资料的均值和可信区间，用线条的高度表示均值的大 
小，可以用“工”表示可信区间，上端表示可信区间的上限，下端表示可信区间的下 
限，中间“I”的长度表示可信区间的长度(参见第六章)。另一种表示方法，可以用 “T” 宇图部分 
表示均数的标准误误差条图有若干种表现方法，本例选择在撰写论文时常用的 
方法，即根据表 5-16 中的数据计算出的均数和标准误绘制误差条图（图 5-7), 从图中可看出试 
验组降压的平均值高于对照组。 

绘制误差条图时应 注意： 如果以横轴为基线，表示各个分组或标志，纵轴则表示各标志相 
应的均值和标准误(或可信区间);纵轴尺度必须从 “0” 开始，表示均值的各直条的宽度要相等， 
直条之间的间隔不必等距。 


表 5-16 试验组和对照组6周后血压 （mmHg) 的变化情况 


试验组 

对照组 

试验组 

对照组 

舒张压 

收缩压 

舒张压 

收缩压 

舒张压 

收缩压 

舒张压 

收缩压 

12 

17 

10 

10 

8 

20 

7 

10 

12 

8 

-4 

-7 

-7 

1 

6 

10 

10 

19 

8 

21 

9 

26 

8 

8 

0 

24 

12 

13 

14 

44 

-4 

6 

16 

9 

10 

-11 

6 

11 

8 

15 

10 

20 

10 

6 

14 

15 

8 

16 

14 

19 

16 

25 

16 

26 

11 

10 

14 

19 

12 

12 

20 

27 

-4 

3 

11 

14 

10 

7 

9 

10 

11 

25 

2 

8 

2 

12 

2 

9 

9 

5 



舒张压 mss . 

图 5-7 试验组和对照组血压的平均变化情况 (X±S 五） 


(五）散点图 

散点图 （scatter plot) 用点的密集程度和变化趋势表示两指标之间的直线或曲线关系，如根 
据表 5-17 绘制成图5-8。结果显示，随着载脂蛋白 B 含量的增加，高血脂患者低密度脂蛋白的 
含量也相应增加。 

绘制散点图时应 注意： 纵轴和横轴各代表一种事物，横轴代表自变量，纵轴代表因变量；纵 
轴和横轴的起点,不一定从 “0” 开始。 



第五章统计表与统计图 


表 5-17 高血脂患者载脂蛋白 B 与低密度脂蛋白的关系 



『5 1 

劍旨蛋白 B(g/L> 


图 5-8 20名高脂血症患者载脂蛋白 B 与低密度脂蛋白关系的散点图 

三、描述定性数据的统计图 

(一）直条图 

直条图 （bar chart) 又称条图，用等宽直条的长短来表示相互独立的统计指标数值大小和它 
们之间的对比 关系。 直条图按直条是横放还是竖放分为卧式和立式两种，按分组因素的多少 
分为单式和复式两种。主要适用于各自独立的统计指标。指标既可以是绝对数，也可以是相对 
数。常用的直条图有两种。 

1 . 单式条图具有一个统计指标 ，一 个分组因素。如根据表 5-18 绘制成的图5-9,描述按 
地区分组的发病率。 



甲地区 乙地区 丙地区 丁地区 
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表 5-18 某省某年四个地区脊髓灰质炎发病率 


地区 

发病率 （1/10 万） 

地区 

发病率 （1/10 万） 

甲 

22.0 

丙 

1.5 

乙 

4.5 

丁 

1.0 


2. 复式条图具有一个统计指标，两个分组因素。如根据表 5-19 绘制成的图5-10。 


表 5-19 某地区1952年与1972年三种疾病的死亡率 


死因 


+ 肺结核 
心脏病 
恶性肿瘤 


1952年 
163.2 

72.5 

52.5 


死亡率 （1/10 万} 


1972年 

27.4 

82.5 
183.5 



图 5-10 某地1952年与1972年三种疾病死亡率比较 

绘制直条图时应 注意： 一般以横轴为基线，表示各分组，纵轴表示各分组相应 的值； 纵轴尺 
度必须从“0”开始，而且要 等距； 直条的宽度要相等，直条的间隔要等距，间隔的距离通常与直 
条的宽度相等或略小。 

(二）构成图 

构成图常用于描述构成比资料。常用的构成图有圆图 (pie chart) 和百分条图 (percentage bar 

1 ■圆图把圆的总面积作为‘100%，表示事物的全部，而圆内各扇形面积用来表示全体中 
各部分所占的比例。如根据表 5-20 单纯型老年性气管炎疗效绘制成图 5-1 lo 


表 5-20 复方猪胆胶囊治疗老年性气管炎近期疗效比较 



单纯型 

哮喘型 


例数 

构成比（％} 

例数 构成比（％} 

临床治愈 

60 

27.15 

23 12.64 

显效 

98 

44.34 

82 45.06 

有效 

51 

23.08 

66 36.26 

无效 

12 

5.43 

11 6.04 

合计 ~ 

221 

100.00 

182 100.00 


圆图绘制 方法： 以圆形的360。角为100%,将各构成部分的构成比(％)乘以3.6。，即得各组 
成部分应占的圆心角 度数； 再以某刻度 （ 比如相当于时钟12时的位置)为起点，顺时针按圆心角 




□临床治愈□显效□有效□无效 
图 5-11 复方猪胆胶囊治疗单纯型老年气管炎近期疗效比较 

度数大小或者自然顺序排列各个扇形。不同的扇形可以用不同的颜色或花纹区别，也可以简要 
注明文字和百分比。 

2. 百分条图用矩形直条的长度表示100%，而用其中分割的各段表示各构成部分的百分 
比。如根据表 5-20 绘制成的图5-12。 



构成比(％) 

□临床治愈 口显效 □有效 口无效 


图 5-12 复方猪胆胶嚢治疗老年性气管炎近期疗效比较 


百分条图绘制 方法： 绘制一条等宽的水平直条，其长度为100%,根据各部分所占百分比， 
按其大小或资料的自然顺序把直条分成若干段，然后在直条的各分段上标出百分比。同一指标 
分层相互比较时，可以绘制多个直条。 


练习题 

一、单项选择题 

1. 统计表的主要作用是 （） 

A. 便于形象描述和表达结果 B. 客观表达实验的原始数据 

C. 减少论文篇幅 D. 容易进行统计描述和推断 

E. 代替冗长的文字叙述和便于分析对比 

2. 描述某疾病患者年龄（岁）的分布，应采用的统计图是 （） 




A. 线图 B. 直条图 

C. 百分条图 D. 直方图 

E. 箱式图 

3. 高血压临床试验分为试验组和对照组，分析考虑治疗0、2、4、6、8周血压的动态变化和 
改善情况，为了直观显示出两组血压平均变动情况，宜选用的统计图是 （） 

A. 半对数图 B. 线图 

C. 直条图 D. 直方图 

E. 百分条图 

4. 研究三种不同麻醉剂在麻醉后的镇痛效果，采用计量评分法，分数呈偏态分布，比较终 
点时分数的平均水平及个体的变异程度，应使用的图形是 （） 

A. 复式条图 B. 复式线图 

C . 散点图 D. 直方图 

E. 箱式图 

5. 研究血清低密度脂蛋白 LDL 与栽脂蛋白 B-100 的数量依存关系，应绘制的图形是 （） 

A. 直方图 B. 箱式图 

C. 线图 D. 散点图 

E. 直条图 

6. 下列统计图适用于表示构成比关系的是 （） 


A. 直方图 
C. 误差条图、条图 
E. 圆图、百分条图 

7 - 对有些资料构造统计表时，下列哪一项可以省略（ ） 
A. 标题 B. 标目 

C. 线条 D. 数字 

E. 备注 

8 - 绘制下列统计图纵轴坐标刻度必须从 “0” 开始的有（ 


B. 箱式图 
D. 散点图、线图 


B. 百分条图 
D. 半对数线图 


B. 百分条图 
D. 误差条图 


A. 圆图 
C. 线图 
E. 直方图 

9 - 描述某现象频数分布情况可选择 （ 

A. 圆图 
C. 箱式图 
E. 直方图 

10. 对比某种清热解毒药物和对照药物的疗效，其单项指标为口渴、身痛、头痛、咳啦、流 
涕、奂塞、咽痛和发热的有效率，应选用的统计图是 （） 

A. 圆图 B. 百分条图 

C. 箱式图 D. 复式条图 

E. 直方图 
^改表和绘图 

I. 某地调查脾肿大和疟疾临床分型的关系、程度与血片查疟原虫结果列表如下，此表 
有何缺点，请改进， 



某地 1975 年 839 例正常人发汞 值( |jg/g )分布资料 _ 

组段 0~ 0.2 - 0.4 - 0.6 - 0.8 - 1.0- 1.2 - 1.4 - 1.6-2.2 合计 

例数 133 193 190 111 83 34 43 16 36 839 

3. 根据下表分别绘制普通线图和半对数线图，并说明两种统计图型的意义。 
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J 


本章开始学习统计推断方法，内容涉及参数估计和假设检验的基本概念和原理。参数估计 
指由样本统计量估计总体参数,是统计推断的重要内容之一，常用的方法有点估计和区间估计。 
区间估计是指按预先给定的概率，计算出一个区间，使它能够包含未知的总体参数。假设检验 
是统计推断的另一重要内容，其目的是比较总体参数之间有无差别。 

第一节参数估计 

一、抽样误差 

在医学研究中，绝大多数情况是由样本信息推断总体特征。由于个体存在差异，因此通过 
样本推论总体时会存在一定的误差，如样本均数亍往往不等于总体均数#，这种由抽样造成的 
样本统计量与总体参数的差异称为抽样误差 (sampling error)。 例如，假设健康成年男子的红细 
胞服从均数为;/ = 4.75 x 10 ,2 /L, 标准差 a=0.38x 10 12 /L 的正态分布，现随机抽取140人，计算红 
细胞的样本均数为 X=4.77 x 10 ,2 /L, 两值之差 0.02 x 10 12 /L 即为抽样误差。可以设想，若再随机 
抽取140名成年男子进行测量，其平均红细胞数会是另一不同的结果。对于抽样研究，抽样误 
差是不可避免的。 

(一）均数的标准误 

如何能精确地估计成年男子红细胞数的总体均数？因为存在抽样误差，基于〗40例研究 
对象的样本均数不可能与总均数完全一样，问题是我们能否知道估计值的精确程度，对此可以 
利用抽样误差的分布规律对其进行分析。理论上可以 证明： 若从正态总体 o 2 ) 中，反复多 
次随机抽取样本含量固定为《的样本，那么这些样本均数X也服从正态分布，即无的总体均 
数仍为 A/， 样本均数的标准差为则根据中心极限 定理： 在样本含量《很大的情况下（如 
於50)，无论原始测量变量服从什么分布, J 的抽样分布都近似服从正态分布，///7 )。 

统计学中为了区别个体观察值之间变异的标准差与反映样本均数之间变异的标准差，将后 
者称为均数的标准误 (standard eiror of the mean )。显然，标准误小于原始测量值的标准差，标准 
误越小说明估计越精确，因此可以用均数的标准误表示均数抽样误差的大小。均数的标准误用 
符号％表示，计算公式为 

(6 -° 

由式 (6-1) 可见，在样本含量一定的情况下，均数的标准误与标准差成正比，说明当总体中各观 
测值变异较小时，抽到的样本均数 J 与总体均数 p 可能相差较小，用I估计#的可^度 较髙； 
当总体中各观测值变异较大时，抽到的样本均数 J 与总体均数//可能相差很大，用 J 估计//的 
可靠程度也相对较低。均数的标准误与样本含量的平方根&成反比，说明在同一总体中随机 
抽样，样本含量„越大,标准误越小。均数的标准误反映了样本均数间的离散程度，也反映了样 
本均数与总体均数的差异。 

实际中，总体标准差往往未知，因而通常用样本标准差 S 代替求得样本均数标准误的 
估计值V计算公式为 

50 
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例 6-1 在某地随机抽査成年男子140人，得红细胞均数 4.77 x 10 ,2 /L, 标准差 0.38 x 10 l2 /L, 
试计算其标 准误。 

按公式 (6-2) 计 算得： 


(二）率的标准误 

样本率的标准差称为率的标准误 (standard error of rate), 可用来描述样本率抽样误差的大 
小。率的标准误越小，则率的抽样误差 越小； 率的标准误越大，则率的抽样误差越大。现记总 
体率参数为 7T， 样本率为在《次独立重复试验中出现的“阳性”次数记为尤，则样本率为 

d jl 


(6-3) 


样本率 p 的总体方差为 

P 的总体标准差（即率的标准误)为 


_ 十(1 一 7 T ) 


在一般情况下，总体率 7T 往往是未知的，此时可用样本率 P 来代替总体率^则心的估计 

值为 

^ ^ (1 ~^ (6_6) 
无论是均数的标准误还是率的标准误，都是抽样分布的重要特征之一，它可用于参数的区 
间估计和不同组之间参数的比较。 


二、 可信区间的概念 

参数估计 (parameter estimation) 指由样本统计量估计总体参数，是统计推断的重要内容之 

— 。常用的估计方式有 两种： 点估计 (point estimation) 和区间估计 (Nerval estimation)。 

点估计是使用单一的数值直接作为总体参数的估计值，如用文估计相应的 A 用^估计相 
应的 tt 。 该法表达简单，但未考虑抽样误差的影响，无法评价参数估计的准确程度。 

区间估计是指按预先给定的概率，计算出一个区间，使它能够包含未知的总体参数。事先 
给定的概率1 称为可信度(通常取 0.95 或 0.99), 计算得到的区间称为可信区间 （ confidence 
interval, Cl)o 可信区间通常由两个数值界定的可信限 (confidence limit) 构成，^中数值较小的 
—方称为下限，数值较大的一方称为上限。总体均数估计的95%可信区间表示该区间包括总 
体均数 A 的概率为95%,即若作次抽样算得100个可信区间，则平均有95个可信区间包括 
〆估计正确)，只有5个可信区间不包括〆估计错误)。例如，估计某地成年男子的红细胞平均 
水平，其95%的可信区间为 4.71 x 10 12 /L 〜 4.83 x 10 l2 /L, 说明总体红细胞均数被包含在这一区间 
的概率为95%。 

可信区间估计的效果，一是由可信度1 -a 来反映，即计算出的区间包括总体均数#的概率 
大小，其值越接近1 越好; 二是由区间的宽度来反映，区间越窄说明估计越精确。在样本含量一 
定的情况下，二者是矛盾的，若仅考虑提高可信度，则使估计的区间变宽，从而降低了使用可信 




三.总体均数的区间估计 

总体均数//可信区间的计算公式可以利用 J 的抽样分布获得。实际中，总体均数可信区间 
的计算方法,根据总体标准差是否已知，以及样 本量” 的大小而有所不同。 

( 一 ） 已知 

如果变量; r 服从均数为/<、标准差为的正态分布，则 

Z= S (6 " 7) 

服从标准正态分布。按照标准正态分布规律，95%的 z 值在 -1.96 和 1.96 之间，即 


p 〔_ 196 分 


J+l .96-^j=0.! 


从而得到95%可信 区间： 


更一般的 情况： 






(6-10) 


- z an°x^ 

其中〜 2为标准正态分布的双侧界值。若取1-« = 0.95,则为总体均数的95%可信区间，或取 
l - a =0.99, 则为总体均数99%可信区间。需要注意的是，//不是一个随机变量，而是包含在可 
信区间内的一个参数值。 

(二）<7未知 

^实上，总体标准差 a 通常是未知的，这时我们可以用其估计量 S 代替〜但在这种情况 
下，(歹-沁/(5/‘)已不再服从标准正态分布，而是服从著名的/分布。 


1. f 分布 f 分布 (f-distribution) 由英国统计学家 W.S.Gosset 于1卯8年以 “Student” 笔名提 
出，他证明了在正态分布总体中进行抽样服从自由度为 v = «_l 的/分布。，分 
布是以0为中心的对称分布,参见图 6-1 。 



由图 6-1 可见，/分布曲线的形态变化与自由度 v = « - 1有关。随着自由度 v 的增大，/分布 
曲线越来越接近于标准正态分布 曲线； 当 V — oo 时，/分布的极限分布就是标准正态分布。因 



此， / 分布曲线下面积95%的界值不是一个常量，它随自由度大小不同而变化。为了应用方便， 
可根据附表2查找相应的 r 界值。 r 界值表中，给出了不同自由度情况下，单侧概率和双侧概率 
值对应的/界值。如当 v=24、 双侧概率《=0.05时，由表中查得 W.24=2.064, 此处 2.064 即为 
两侧尾部概率各为 0.025 的 r 界值。由于/分布的对称性，表中只列出了正值。 

2. 可信区间的计算计算可信区间的原理与 a 已知情况完全相同，仅仅是两侧概率的界值 
有些差别。按/分布规律， 100%x(l -«) 的/值在之间，即 

将上式写成可信 区间： 



U. v 界值可以由附表2查得。需要 注意： 在小样本情况下，应用这一公式的条件是原始变量义服 
从正态分布。 

在大样本情况下(如«>50),无论变量是否服从正态分布，按照中心极限定理I都服从 
正态分布，同时 < 分布逼近标准正态分布，可信区间可以用下式近似计算： 



例 6-2 某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为 3.32g/L, 标准 
差为 0.57g/L, 试计算该种病人血浆纤维蛋白原含量总体均数的95%可信区间。 

本例《 = 25， 3.32 ，<5= 0.57，v=«-l=25-l = 24，a=0.05 ，查 /值表 W.24 = 2.064, 按公 
式 (6-12) 计 算得： 

下限： X- t al 2 tV S^ = 3.32 - 2.064 x 0.57/^5 = 3.08(g/L) 

上限： J+ t an , v S 7 = 3.32 + 2.064 x 0.57/>/S=3.56(g/L) 

根据该资料计算得到，动脉粥样硬化病人血浆纤维蛋白原含量总体均数的 95% 可信区间 
为 3.08 〜 3.56g/L 0 

例 6-3 试计算例 6-1 中该地成年男子红细胞总体均数的95%可信区间。_ 

本例属于大样本，可采用正态近似的方法计算可信区间(《 = 0.05)。因为1=4.77,5=0.38, 
«= 140,则95%可信区间为 

下限： J-z„, 2 S ? = 4.77-l.%x0.38/Vi^ = 4.71(x 10 I2 /L) 

上 限：歹 +z„, 2 S 7 = 4.77+l.%x0.38/>/i^ = 4.83( x 10 12 /L) 

估计该地成年男子红细胞总体均数的95%可信区间为 4.71 X 10 12 /L~4.83x 10 12 /L。 

3. 单侧可信区间前面涉及的都是双侧可信区间。但有些情况下，我们所关心的仅仅是 
单侧的可信限。例如，对轻度原发性高血压患者进行治疗，一般病人接受治疗后可以使舒张压 
平均降低 lOmmHg, 现提出一种新的治疗方法，我们仅对此疗法是否优于标准法感兴趣，为此有 
100名患者接受了这种新疗法，得到的数据显示舒张压平均降低 12.7mmHg, 血压治疗前后变化 
的标准差为 5.6mmHg, 能否说新疗法优于标准疗法 (<x = 0.05)? 为此可以计算单侧可信区间，其 
中只需关心可信区间的下限，即如果下限值高于 lOmmHg, 我们就有理由下结论说新疗法优于 
标准疗法。 

单侧可信区间与双侧可信区间的计算公式基本相同，只需将公式 (6-12) 和 (6-13 冲的抽样 
分布的双侧界值换成单侧界值，同时只取下限或上限。本例95%可信区间下限为 
.= 12-7-1.66x5.6/^00 =11.8(mmHg) 

即有95%的把握推断新药平均降压至少为 ll.SmmHg, 优于标准疗法。 



四、两总体均数差值的区间估计 


实际中，有时需要计算两个总体均数差值的可信区间，例如通过计算两种降压药物平均降 
压的差值比较两种药物的差别，其双侧 100( 1 - a )% 可信区间的计算公式为 


(6-14) 

其中， v=«, +7^-2 为自由度,为两样本均数之差的标准误，当两总体方差相同时，则 

(6 - i5) 


其中 S/ 为两样本的合并方差。当两样本的样本含量均较大时(如 n, 和均大于 M), 上述计算 
可信区间中的 Q. v 可用相应的代替，而且无论两总体的方差是否相同，有 


(6 " i6) 

例 6-4 评价复方缬沙坦胶囊与缬沙坦胶囊对照治疗轻中度高血压的有效性，将102名 
患者随机分为两组，其中试验组和对照组分别为54例和48例。经六周治疗后测量收缩压， 
试验组平均下降 15.77mmHg, 标准差为 13.17mmHg; 对照组平均下降 9.53mmHg, 标准差为 
13.55mmHg。 试估计两组收缩压平均下降差值的95%可信区间。 

由式(6-15)、式 (6^16) 计算，得 

S 卜 (54-l)xl3.17 2 + (48-l)xl3.55 2 ㈣⑵ 


^_^ = Jl78.221x^ + ±j =2.6483 

查附表2的/界值表得 100 = 1.984, 由公式 (6-14) 两组总体均数之差的 95% 可信区间为 
下限： (J,-J 2 )- t an , v Sn = (15.77 -13.17)-1. 984 x 2.6483 = 一 2.65 
上限 •• （无, -J 2 ) + t an , v Sn = (15.77 - 13.17) +1 .984 x 2.6483=7.85 
即两组收缩压平均下降差值的 95% 可信区间为 -2.65 〜 7.85mmHg。 

五、总体率的区间估计 

总体率的点估计是直接用样本率 p 作为总体率; r 的点估计值，因其未考虑抽样误差，在实 
际的医学研究中，经常使用总体率的区间估计。 

1 . 小样本率的区间估计利用二项分布可估计其总体率11可信区间，《 一般取0.05。对 
于《<50,且 p 接近于0或1时，可直接査附表6百分率的可信区间表得到其总体率的可信区间。 

例 6-5 2003年4^6月某医院重症监护病房收治重症 SARS 患者38人，其中死亡14人，求 
SARS 病死率的95%可信区间。 

查附表6,在《 = 38，义=14的纵横交叉处的数值上行22〜54,下行18〜59,即 SARS 病死率 
95%的可信区间为22%~54%。 

注意 ：附表 6 中的义 只列出 X ^ n /2 部分，当 A>«/2 时，应以值査表，然后用100减去 
查表得到的数值，即为所求的可信区间。 

2. 大样本率的区间估计当/I较大, P 和 l-p 均不太小，如叩和《(卜尸)均大于5时，可 
利用样本率 p 近似服从正态分布的原理来估计总体率的1 -a 可信区间，计算公式为 

P^ZanSp 


(6-17) 
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M ^ S p = yjpa - p )/ no 当 fl=0.05 时， 4.0^=1.960 

例 6-6 某区疾病预防控制中心2002年对该乡镇250名小学生进行贫血的检测，结果发现 
有86名贫血者，检出率为34.40%,求贫血检出率95%的可信区间。 

本例《 = 250较大，且即= 86， 《( 1 -/7 )= 164均大于5，可用 ( 6-17 )公式计算总体率95%的 
可信区间。 

々〜序= 0. 3 则一， 0.4 ㈣ 

即该乡镇小学生贫血检出率95%的可信区间为28.51%>40.29%。 

六、两总体率差值的区间估计 

设两样本率分别为 p, 和仍，当％与《 2 均较大，且灼，1 _灼及仍，1 -仍均不太小 ，如” 、 
«,(1 - Px \ n 2 p ^ n 2 {\ -仍)均大于5时，可采用正态近似法对两总体率差值进行可信区间估计， 
其计算公式为 

(A 一 夕2) 土 ZanSpy-h (6-18) 

其中 

不 和不分 别表示两组中某事件发生的例数。 

例 6-7 某医院口腔科医生用极固宁治疗牙本质过敏症，以双氟涂料作对照，进行了 1年的 
追踪观察，结果见表 6-1 所示，试估计两组有效率差别95%的可信 区间。 

表 6-1 治疗牙本质过敏症两组有 效率的比较 _ 

组别 总牙数 有效数 有效率(％) 

试验 "S 77 61 " 79^2 

对照组 69 _ 38__ 

合计 _ 146 99 6781 


U - + =^. 6781 x(l- 0.6781)x[i + iJ=' 


两组总体率差别95%的可信区间为 

(Pi 一 P 2 ) 土 (0.7922 - 0.5507) ± 1 .96 x 0.0775 = (0.0896 ， 0.3934) 

即两组治疗效果的总体有效率之差的95%可信区间为8.96%~39.34%。 


第二节假设检验 
一、基本原理 

假设检验 (hypothesis test) 亦称显著性检验 (significant test), 是统计推断的另一重要内容，其 
目的是比较总体参数之间有无差别。实际中多数情况是用样本数据去推断总体，由于存在生物 
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个体变异和随机测量误差，不能简单地根据样本统计量数值的大小直接比较总体参数。如在比 
较甲乙两种治疗高脂血症药物疗效的试验中，甲乙两组各为100名患者，甲药使血清甘油三酯 
平均下降 1.36mmol/L， 乙药使血清甘油三酯平均下降 1.12mmol/L， 这一结果并不能说明甲药优 
于乙药，因为如果再重新做一次试验其结果可能相反。假设检验的基本思想是，首先对所需要 
比较的总体提出一个无差别的假设，然后通过样本数据去推断是否拒绝这一假设。其意义可由 
下面的例子说明。 

例 6-8 使用黑加仑油软胶囊治疗高脂血症，30名患者治疗前后血清甘油三酯检测结果的 
差值为 1.38±0.76(mmol^), 问治疗后血清甘油三酯是否有所改善？ 

对上面问题可以作如下 考虑： 如果治疗前后血清甘油三酯没有改善，则前后变化差值的总 
体均数应为〜=0,但现在计算出的样本差值均数 1.38 ，其差别可能由两种原因弓I起，即药物 
的作用和生物变异性波动。现用假设//。:心=0表示治疗前后没有差别，需要判断的是这个假 
设^否符合实际检测结果。我们知道，即使治疗前后血清甘油三酯没有改善，由于生物的变异 
性，3不会恰好等于0;但当 J-0 较大时，血清甘油三酯的改变就难以完全用生物变异来解释， 
从而认为药物具有作用。问题是 3-0 究竟要大到多少才能够下这样的结论？ 

由前一节知道，如果治疗前后血清甘油三酯检测结果的差值服从正态分布，在尺。:仏=0成 
立的条件下， Z = (5-0)/CV‘) 服从，分布 (& 为差值的标准差)。因此，可以利用现有样本计算 
/统计量，然后根据/分布得到能有如此大差异的概率 P 进行判断，如果这种概率很小，即计算出 
的/值超出了给定的界限(检验水准)，则倾向于拒绝假设 // D ， 认为治疗前后有差别(参见图6-2)。 



图 6-2 利用 f 分布进行假设检验原理示意图 


假设检验的实质是判断观察到的“差别”是由抽样误差引起还是总体上的 f ，目的是评价 
两种不同处理引起效应不同的证据有多强，这种证据的强度用概率度量和表示。除/分布外， 

I针对不同的资料还有其他各种检验统计量及分布，如 /T 分布、/分布等，应用这些分布对不同类 
| 型的数据进行假设检验的步骤相同，其差别仅仅是需要计算的检验统计量不同。 

二、基本步骤 

(― ) 建立假设和确定检验水准 

假设检验中，包括原假设 (null hypothesis) 和备择假设 (alternative hypothesis) 两种 假设。 
原假设符号为 // fl ， 指需要检验的假设，如治疗前后血清甘油三酯没有差别，即 
H 0 -/i d =0 

!这—假设通常与我们要验证的结论相反，是计算检验统计量和/>值的依据。 

备择假设符号为//,，是在//。成立证据不足的情况下而被接受的假设，如拒绝治疗前后血 
I 清甘油三酯相同的假设，可表示为 

备择假设有双侧和单侧两种情况。双侧检验指无论是正方向还是负方向的误差，若显著地超出 
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检验水准则拒绝风，况»0即为双侧检验。单侧检验指仅在正方向或负方向误差超岀规定 
的检验水准时则拒绝风，如治疗后血清甘油三酯下降的假设可表示为 
况: 心> 0( 或 //,:&<()) 

双侧检验和单侧检验应如何选择，需根据研究目的和专业知识而定。例如，比较两种降血 
脂药物的疗效，因无法判断两种药物的优劣，应选用双侧 检验； 如果是检验一种药物的降血脂 
作用，因为药物一般总是能降低血脂而不是升高血脂，这时可以采用单侧检验。由于双侧检验 
将拒绝域的概率等分在/分布两侧的尾部，因此单侧检验的/界值(绝对值)总是小于双侧检验 
所用的界值。对同一样本，双侧检验得出有显著性差别的结论，单侧检验也一定是显著的，因 
而在实际中使用较多的是双侧检验。本书中在未作说明的情况下，选用的均是双侧检验。 

建立检验假设的同时，还必须给出检验水准。检验水准亦称显著性水准 (significant level), 
用 a 表示，是预先规定的拒绝域的概率值，实际中一般取《=0.05或 a = 0.01。 显然 ’a 值越大越 
容易得出有差别的结论。 

(二） 选择检验方法和计算检验统计量 

根据资料类型、研究设计方案和统计推断的目的，选择适当的检验方法和计算公式。许多 
假设检验方法是以检验统计量来命名的，如 f 检验、 z 检验、 F 检验和/检验等，这些都是后面章 
节要学习的重要内容。 

(三） 根据尸值做出统计推断 

查表得到检验用的临界值，然后将算得的统计量与拒绝域的临界值作比较，确定/*值。如 
对双侧/检验则尸<«，按《检验水准拒绝风，接受况；若户>«，则不能拒绝风。戶值 
是假设检验下结论的主要依据，其含义是指在原假设成立的条件下，观察到的样本差别是由于 
机遇所致的概率。因此， P 值越小越有理由拒绝原假设，认为总体之间有差别的统计学证据越 
充分。需要 注意： 不拒绝风不等于支持风成立，仅表示现有样本信息不足以拒绝汉)。 

我们在下结论时，应使用“差异有无统计学意义”进行表述。由于统计软件的应用和普及， 
最好列出精确的尸值，以便对检验结果的可靠性做出准确的判断，当软件输出/^ 0.000 时，应 
写成“户<0.001”。在没有统计软件的情况下，也可以通过查阅界值表得到尸值的所在范围。 



— 、单项选择题 

1. 样本均数的标准误越小说明 （） 

A. 观察个体的变异越小 B. 观察个体的变异越大 

C. 抽样误差越大 D. 由样本均数估计总体均数的可靠性越小 

E. 由样本均数估计总体均数的可靠性越大 

2. 抽样误差产生的原因是（ ） 

A. 样本不是随机抽取 B. 测量不准确 

C. 资料不是正态分布 D. 个体差异 

E. 统计指标选择不当 

3. 要减少抽样误差，通常的做法是 （） 

A. 减小系统误差 B. 将个体变异控制在一定范围内 

C. 减小标准差 D. 控制偏倚 

E. 适当增加样本含量 
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4. 对于正偏态分布的总体，当样本含量足够大时，样本均数的分布近似为 （） 

A . 正偏态分布 B . 负偏态分布 

C . 正态分布 D . /分布 

E . 标准正态分布 

5. 用某种中成药治疗高血压患者100名，总有效率为80.2%,标准误为 0.038, 则总有效率 
的 95 %可信区间估计为（ ） 

A . 0.802± 1.64 x 0.083 B . 0.802± 1.96 x 0.083 

C . 0.802士2.58 x 0.083 D . >0.802 一 1.64 x 0.083 

E . <0.802 + 1.64 x 0.083 

6. 根据样本资料算得健康成人白细胞计数的95%可信区间为 7.2 xl 0 9 / L ~9.1 x IOVL ， 其 
含义是 （） 

A . 估计总体中有95%的观察值在此范围内 

B . 总体均数在该区间的概率为95% 

C . 样本中有95%的观察值在此范围内 

D . 该区间包含样本均数的可能性为95% 

E . 该区间包含总体均数的可能性为95% 

7-某地抽取正常成年人200名，测得其血清胆固醇的均数为 3.64 mmol / L , 标准差为 
1.20 mmol / L , 则该地正常成年人血清胆固醇均数95%的可信区间是 （） 

A . 3.64± 1.96 x 1.20 B . 3.64±1.20 

C . 3.64±1.96 xi .20/>/200 D . 3.64± 2.58 x 1. 20/^200 

E . 3.64±2.58 xl .20 

8. 假设检验的目的是 （） 

A . 检验参数估计的准确度 B . 检验样本统计量是否不同 

C . 检验样本统计量与总体参数是否不同 D . 检验总体参数是否不同 

E . 检验样本的 P 值是否为小概率 

9. 假设检验差别有统计学意义时， P 越小，说明 （） 

A . 样本均数差别越大 

B . 总体均数差别越大 

C . 认为样本之间有差别的统计学证据越充分 

D . 认为总体之间有差别的统计学证据越充分 

E . 认为总体之间有差别的统计学证据越不充分 
10•关于假设检验，正确的说法是（ ） 

A . 检验水准必须设为 0.05 B . 必须采用双侧检验 

C . 必须根据样本大小选择检验水准 D . 必须建立无效假设 

E . 要说明无效假设正确，必须计 算尸值 
二、计算与分析 

1. 为了解某地区小学生血红蛋白含量的平均水平，现随机抽取该地小学生 4 50人，算 
得其血红蛋白平均数为 101.4g/L, 标准差为 1.5g/L, 试计算该地小学生血红蛋白平均数的 
95%可信区间。 

2. 新药临床试验对加替沙星冻干粉针治疗细菌感染进行随机对照研究，采用左氧氟 
沙星作为对照组，试验组和对照组的例数分别为102和104例，试验结果加替沙星冻干粉 






针的有效率为94.4%,左氧氟沙星的有效率为91.26%,试计算两组有效率差值的95%可信 
区间。 

3. 研究高胆固醇是否有家庭聚集性，已知正常儿童的总胆固醇平均水平是 l 7 5mg/dl, 
现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为 207.5mg/dl, 标准差 
为 30mg/dl。 问题： 

( 1 ) 如何衡量这100名儿童总胆固醇样本平均数的抽样误差？ 

(2) 估计100名儿童的胆固醇平均水平的95%可信区间。 

(3) 根据可信区间判断高胆固醇是否有家庭聚集性，并说明理由。 
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本章介绍计量资料两组均数比较的 r 检验方法，根据研究设计和资料的性质有单个样本/ 
检验、配对样本/检验、两个独立样本/检验以及在方差不齐时的^检验。/检验的理论依据是 
上一章介绍的£分布和假设检验 原理。 

第一节 f 检验 

一、 _本/检验 

单样本/检验 (one-sample Mest) 又称单样本均数/检验，适用于样本均数歹与已知总体均 
数外的比较，其比较目的是检验样本均数亍所代表的总体均数//是否与已知总体均数 /A) 有差 
别。已知总体均数抑，一般为标准值、理论值或经大量观察得到的较稳定的指标值。 

单样本^检验用于总体标准差 rx 未知的资料，其统计量/值按公式 ( 7-1 H 十算： 



其中5为样本标准差，„为样本 含量。 

例 7-1 以往通过大规模调查已知某地新生儿平均出生体重为 3.30kg。 从该地难产儿中随 
机抽取35名新生儿作为研究样本，平均出生体重为 3.42kg, 标准差为 0.40kg, 问该地难产儿出 
生体重与一般新生儿体重有无 差异？ 

本例已知总体均数凡 =3.30kg, 但总体标准差卩未知，《=35,为小样本, X=3.42kg, 5=0.40kg, 
故选用单样本（检验。 

( 1 ) 建立检验假设，确定检验水准 

该地难产儿与一般新生儿平均出生体重相同 
该地难产儿与一般新生儿平均出生体重不同 

«=0.05 

(2) 计算检验统计量 

在#=枸成立的前提条件下，计算统计量为 



(3) 根据 P 值,作出推断结论 

本例自由度 v = «- 1 =35- 1 =34,查附表2,得 / O .o5/2.34 = 2.032o 因为 /<4。 5 / 2 , 3 4,故々0.05, 
表明差异无统计学意义，按 ot = 0.05 水准不拒绝 i/。， 即根据现有样本信息，尚不能认为该地难产 
儿与一般新生儿平均出生体重存在差异。 

:、 fii ! 对样本均数 f 检验 

配对样本均数/检验简称配对/检验 (paired/ test), 又称非独立两样本均数〖检验，适用于配 
对设计计量资料均数的比较，其比较目的是检验两相关样本均数所代表的未知总体均数是否有 
差别。配对设计 (paired design) 是将受试对象按某些重要特征相近的原则配成对子，每对中的 
60 
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两个个体随机地给予两种处理。应用配对设计可以减少实验误差和控制非处理因素，提高统计 
处理效率。配对设计有两种 情况： ①同源 配对： 同一受试对象或同一标本的两个部分，随机分 
配接受两种不同 处理； ②异源配对：为消除混杂因素的影响，将两个同质受试对象配对分别接 
受两种处理，如把同窝、同性别和体重相近的动物配成一对,或把同性别、年龄相近及病情相同 
的病人配成一对。 

配对设计的资料具有对子内数据一一对应的特征，研究者应关心对子的效应差值而不是 
各自的效应值。因此进行配对<检验时,首选应计算各对数据间的差值 d , md 作为变量计算均 
数。配对样本 < 检验的基本原理是假设两种处理的效应相同，理论上差值 d 的总体均数叫为0, 
现有样本差值均数不等于0的3可以来自 ft =0 的总体，也可以来自 ^* 0 的总体。因此可将该 
检验理解为差值样本均数7与已知总体均数叫=0比较的单样本 f 检验,其检验统计量为 



式中为每对数据的差值, S 为差值样本的均数, S, 为差值样本的标准差,&为差值样本均数的 
标准差，即差值样本的标准误,》为配对样本的对子数。 

例 7-2 某项研究评估咖啡因对运动者的心肌血流量的影响，先后测定了 12名男性志愿者 
饮用咖啡前后运动状态下的心肌血流量 [ml/(min-g)], 数据如表 7-1 所示，问饮用咖啡前后运动 
者的心肌血流量有无差异。 

表 7-1 1.2 名运动者饮用咖啡前后的心肌血流量 [ml/( min-g)] _ 


编号 

饮用前 

饮用后 

差值 d 

d 2 


1 

4.8 

4.8 

0 

0 


2 

5.1 

4.9 

0.2 

0.04 


3 

6.4 

4.5 

1.9 

3.61 


4 

5.7 

5.4 

0.3 

0.09 


5 

5.6 

4.7 

0.9 

0.81 


6 

5.3 

3.8 

1.5 

2.25 


7 

5.1 

4.1 

1.0 

1.00 


8 

4.9 

3.2 

1.7 

2.89 


9 

4.7 

3.0 

1.7 

2.89 


10 

3.5 

3.2 

0.3 

0.09 


11 

5.2 

5.3 

-0.1 

0.01 


12 

5.3 

5.1 

0.2 

0.04 


合计 



9_6(1>) 

13.72( 

尸） 


( 1 ) 建立检验假设,确定检验水准 

«o：^=0, 饮用咖啡前后运动者的平均心肌血流量差异为零 
H , ：^#0,饮用咖啡前后运动者的平均心肌血流量差异不为零 
a=0.05 

(2) 计算检验统计量 

先计算差值 t/ 及 rf 2 ,如表 7-1 第四、五列所示。经计算： 

= 9.6, ^d 2 = 13.72, d^(Y I d)/n = 9.6/12 = 0.8 ! 笔记 




计算差值的标 准误： 

按式 (7-2) 计算 ，得： 

/ = _ = 3.738 

S 2 0.214 

(3) 根据尸值作出推断结论 

自由度 v=«- 1 = 12- 1 = 11，查附表2, 得： W.n =2.201 

本例差别有统计学意义，拒绝//。，接受//,，可以认为饮用咖啡前后运 
动者的心肌血流量存在差异。 


三、 两独立样本均数 < 检验 

两独立样本 f 检验 (two-sample /-test), 又称成组/检验，它适用于完全随机设计的两样本均 
数的比较，其目的是检验两样本所来自总体的均数是否相等。完全随机设计是将受试对象随机 
地分配到两组中，每组对象分别接受不同的处理，分析比较两组的处理效应。 

两独立样本/检验要求两样本所代表的总体服从正态分布% 2 )和 N ( M 2, a 2 2 ), 且两总 
体方差 <Ti 2 = cr 2 2 , 即方差齐性 (homogeneity of variance ) 0 若两者总体方差不齐，可米用〆检验、变 
量变换或用秩和检验方法处理。 

两独立样本 Z 检验的检验假设是两总体均数相等，即％: 灼 =// 2 ,也可以表述为 ^~^2 = 0, 
这里可将两样本均数的差值无- 瓦看成 一个统计量,就是差值的标 f 误，则在故条件下 
两独立样本均数£检验可视为样本无- 足与 已知总体均数^ -灼=0比较的单样本〖检验，统计 
量计算公式为 

(7.3) 

S x x -X, 

其中 


S 卜 _L_ _ _^ — (7-5) 

公称为合并方差 (pooled variance), 公式 (7-5) 可用于已知两样本观察值原始资料时计算，当两 
样本标准差&和馬已知时，合并方差圮为 


s2 = Cn l - l ) S l 2 + Cn 2 - V ) S 2 2 (7 . 6 ) 

C « 1 +« 2-2 

例 7-3 某项研究评估低氧环境(模拟高原环境)对运动者心肌血流量的影响，将 n 名男性 
志愿者随机分成两组，分别在正常含氧环境（正常组）和低氧环境(低氧组）中测定运动后的心 
肌血流量 [ml/(mi n «g)]， 数据如表 7-2 所示，问两种环境中运动者的心肌血流量有无差异。 




表 7-2 17名运动者的心肌血流霣 [ml/(miivg)] 
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正常组心肌血流置 ( X ) 低氧组心肌血流量 (} 1 

正常组心肌血流量 { X ) 低氧组心肌血流 S( ) 

3 

3 

3 

2 

2 

.5 6.4 

.1 5.7 

,1 5.6 

7 5.3 

5 5.1 

2.3 4.9 

2.3 4.7 

2.2 3.5 


( 1 ) 建立检验假设，确定检验水准 

= fh ， 两种环境中运动者的心肌血流量的总体均数相同 
H l ： ^ 抑1 ，两种环境中运动者的心肌血流量的总体均数不同 
a = 0.05 

⑵计算检验统计量 
由原始数据计 算得： 

=9, = 23.9, X^, 2 = 65.27, $ = 2.656 

«2=8，X^2 =41.2, Y, x l = 217.26, = 5.150 


代入公式 (7-5) 和 (74)， 得： 


27-jMl + 217.26-i^ 


按式 (7-3) 计算，得 


S U，|>. 459x (}+{) = 0.329 



0.329 


= 7.581 


(3) 根据 P 值，作出推断结论 

两独立样本^检验自由度为 v = Hi + w 2 -2=9 + 8-2=15 ; 査/界值表，/ 0 .05/2.1 5 =2.131。由于 
^>Wi5, 户<0.05,按 a=0.05 的水准拒绝 // D , 接受 况 ，两组差异有统计学意义，可以认为两种 
环境中运动者的心肌血流量存在差异。 

有些资料(如抗体滴度的资料)，宜用几何均数表示其平均水平。由于这些资料不服从正态 
分布（常服从对数正态分布),两样本的总体方差也可能不等，当进行几何均数的假设检验时， 
应先进行变量的对数变换，即将这些观察值尤用 lg 义来代替， lgl 往往近似服从正态分布，相应 
的两总体方差也可能相等，故可用前述的三种形式的/检验对 lgZ 进行分析。 


第二节方差不齐时两样本均数的检验 


当两总体方差不等(方差不齐)时，两独立样本均数的比较,可采用检验，亦称近似〖检验 


variance estimation Mest) 0 


一、方差齐性检验 

由两样本方差推断两总体方差是否相同的检验方法可用尸检验。 F 检验要求资料服从正态 
分布。检验统计量 F 值按式 (7-7) 计算 ，得： 


笔记 
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„ S, 2 ( 较大) , , ，”、 

^(g/|N ) ，V，=n ' _1，V2 = B2_1 (7 ' 7) 

式中 s, 2 为较大的样本方差 ,s 2 2 为较小的样本方差。检验统计量尸值为两个样本方差之比，若样 
本方差的不同仅为抽样误差的影响, F 值一般不会偏离1太远。求得厂值后，査附表 3( 方差齐 
性检验用的尸界值表)得尸值。一般取 a = 0.10 或 a = 0.05 水准作判断，若於心. (-,.») ，则尸名 a ， 
拒绝 H。， 接受印，可认为两总体方差 不齐; 反之,则认为两总体方差具有齐性。 

例 7-4 两组小白鼠分别饲以高蛋白和低蛋白饲料,4周后记录小白鼠体重增加量 (g) 如表 
7-3 所示，问两组动物体重增加量的均数是否相等？ 

表 7-3 两种饲料喂养小白鼠4周后体重增重 (g) 情况 


高蛋白组体重增加量 低蛋白组体重增加量 

(XJ (X 2 ) 

高蛋白组体重增加逼 

(XJ (x 2 ) 

50 36 

47 38 

42 37 

43 38 

39 36 

51 39 

43 * 37 

48 35 

51 33 

42 37 

50 39 

43 34 

36 


( 1 ) 建立检验假设,确定检验水准 

«o： <=4,即高蛋白与低蛋白饲料喂养后小白鼠体重增加量的总体方差相同 
+ 即高蛋白与低蛋白饲料喂养后小白鼠体重增加量的总体方差不同 

a=0.05 

(2) 计算检验统计量 

对表 7-3 的数据计算可得幻 =17.659, 埒 =3.269, 按式 (7-7) 计算，得 


(3) 根据/>值，作出推断结论 

自由度 v 丨=12-1 = 11,力=13-1 = 12,査方差齐性检验用的尸界值表（附表3)，巧. 05/2 , ( „, 12 产 
3.34, 厂>巧.咖. ( „, 12 ),故 P<0.05, 差别有统计学意义，按 a=0.05 水准，拒 绝风， 接受况。故认为 
两组体重增加量的总体方差不齐,不可直接用两独立样本均数/检验，而应采用下述的^检验。 

二 f 检验 

t . 检验有三种方法，包括 Satterthwaite 法近似 Z 检验、 Welch 法近似丨检验和 Cochran & Cox 
法近似/检验。 Cochran* Cox 法是对临界值校正， Satterthwaite 法和 Welch 法是对自由度进行校 
正。这里主要介绍 Satterthwaite 法和 Cochran & Cox 法 0 f 统计量的计算公式为 


Cochran & Cox 法校正临界值为 

, ^jj f a/2.v 4 
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式中V, =«| - 1， V 2 = « 2 - 1 ,根据校正的临界值，做出推断结论。 
Satterthwaite 法〆检验的自由度校正公式为 


(7-10) 


根据自由度查 Z 界值表，做出推断结论。 Satterthwaite 法是目前统计软件中使用最多的，检验 
方法。 

例 7-5 对例 7-4 资料进行^检验，比较两组小白鼠增重均数是否不同。 

( 1 ) 建立检验假设，确定检验水准 

即两种饲料小白鼠增重总体均数相同 
即两种饲料小白鼠增重总体均数不相同 


a=0.05 


(2) 计算检验统计量 

两总体方差不同，应选用/检验。即 



(3) 根据/>值，作出推断结论 
按 Satterthwaite 法计算校正自由度，得 


CSfM + Sl ! r 0 2 (17.659 2 /12+3.269 2 /13) 2 



= 11.696-12 


查 f 界值表， W..2=2.179, / ， >/o.05/2..2,i > <0.05o 

按 Cochran & Cox 法计算校正界值， 先査/ 界值表，得 W.n=2.201, W..2 = 2. 179,再按公 
式(7-9)，算得 

5|/ B/2iVi + 5| i / a/2tVj 1.472x2.201 + 0.251x2.179 、，加 
_=砖+碎一 " = 「472 + 0.25!- = 2 . 198 


A405/2, 得尸<0.05。 

两种检验方法所获得的界值虽略有差异，但结论是一致的。按«=0.05水准，拒绝汉)，接受 
况，差异有统计学意义，可认为两种饲料饲养后小白鼠增重的总体均数不同，即高蛋白组的体 
重增加量高于低蛋白组。 


第三节 f 检验中的注意事项 

1. 假设检验结论正确的前提作假设检验用的样本资料，必须能代表相应的总体，同时各 
对比组具有良好的组间均衡性，才能得出有意义的统计结论和有价值的专业结论。为此要求有 
严密的实验设计和抽样设计,如样本是从同质总体中抽取的一个随机样本、试验单位在干预前 
随机分组等。 

2. 检验方法的选用及其适用条件应根据分析目的、研究设计、资料类型、样本量大小等 
选用适当的检验方法。<检验以正态分布和方差相同为基础，资料是否满足条件可用正态性检 
验和方差齐性检验的方法，或直观地通过数据分布进行判断。若资料不符合上述条件，可以 
使用检验，也可以进行数据变换或选用第十章的非参数检验方法。在大样本情况下（如, 




3. 双侧检验与单侧检验的选择需根据研究目的和专业知识予以选择。通常情况下，因 
为无法事先从专业上判断是否一定有//,叫 2 (或叫印 2 ),因此更多采用双侧检验。单侧检验通常 
根据研究目的决定，如果在决策时只与检验的一侧结果有关(如非劣效性研究),则可以采用单 
侧检验。单侧检验和双侧检验中的I值计算过程相同，只是 < 界值不同，在相同检验水准下（如 
«=0.05),对同一资料作单侧检验更容易获得显著的结果。单双侧检验的选择，应在统计分析工 
作开始之前根据专业知识决定,若缺乏这方面的依据 ，一 般应选用双侧检验。 

4. 假设检验的结论不能绝对化假设检验统计结论的正确性是以概率作保证的，作统 
计结论时不能绝对化。在报告结论时，最好列出概率 P 的确切数值，当/'值很小时，可以用 
P<0.0001 表示； 同时应注明采用的是单侧检验还是双侧检验，以便读者与同类研究进行比较。 

5. 正确理解 P 值的统计意义/>值的意思指在原假设成立的条件下，观察到的试验差别 
是由于机遇所致的概率。因此, P 值越小越有理由拒绝原假设，认为不同组之间有差别的统计 
学证据越充分。因此 ，尸 《<«只能说明差异具有统计学意义，并不代表实际差异的大 t。 从本章 
t 检验的计算公式可以看出，假设检验的结论与样本大小有关，当样本量足够大时，标准误趋于 
零,无论两样本均数相差多少,都能得到拒绝的 < 值和/■值。 

6. 假设检验和可信区间的关系假设检验用于推断总体均数间是否不同，而可信区间则 
用于估计总体均数所在的范围，计算时都利用了抽样误差估计公式。假设检验能够说明组间是 
否具有差别，而可信区间则能够说明差别有多大，帮助判断结果是否具有实际意义，因此在医 
学研究论文中通常都要求提供可信区间。 

第四节假设检验中两类错误 

假设检验无论是拒绝 ■。还 是不拒绝私,都可能犯错误,见表7*4。 


表74假设检验的两类错误 


札成立 I类错误 U) 推断正确 （1- 

_ 好.财 _ 推断正确 (1 -彡) _ n 类错误 W _ 

当丑。为真时，假设检验结论拒绝 i/。, 接受//,,这类错误称为I类错误 (WPS I error), ^医学 
中亦称假阳性错误。检验水准 a 是预先规定的允许犯I类错误的概率，当 a=0.05 时，表 示在甩 
为真的条件下重复100次试验,理论上会有5次拒绝//„。 

当真实情况为玛不成立时,假设检验结论不拒绝//。,这类错误称为II类错误 (typell error), 
在医学中亦称假阴性错误。其概率大小用办表示。 於只 取单侧，其值的大小一般未知，对于计 
量资料必须在知道两总体的标准差、均数的实际差值和样本含量时才能算出。 

为了更好地理解两类错误的意义，以样本均数与总体均数比较的单侧 < 检验来说明^见图 
7-1。设若 W。 实际上成立，但由于抽样误差的存在，偶然得到较大的无值， 
使得 叫.”按 « = 0.05的检验水准拒绝丹。,接受风，结论为此时犯£类错误最大可能概 
率值为《。相反，若/<确实大于/!„，(//„不成立)，但由于偶然性得到较小的无值，使得检 
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验结论不拒绝//。，此时犯的是II类错误，其概率为火统计学上把1 称为检验效能 (power of a 
test), 也称把握度，表示当两总体确实有差别时，按规定的检验水准能发现其差别的能力。由图 
7-1 中可见，给定的检验水准《值越小，出现 n 类错误的概率^越大，反之亦然。若要同时减小《 
和 A， 可以通过增加样本量的方法实现。 



^ H ~ 

图 7-1 I类错误和 n 类错误示意图 



— 、单项选择题 

1. 两样本均数之差的标准误反映的是 （） 

A. 两样本数据集中趋势的差别 B. 两样本数据的变异程度 

C. /分布的不同形状 D. 数据的分布特征 

E. 两样本均数之差的变异程度 

2. 两样本均数比较，检验结果尸 >0.05 说明 （） 

A. 两总体均数的差别较小 B. 两总体均数的差别较大 

C. 支持两总体无差别的结论 D. 不支持两总体有差别的结论 

E. 可以确认两总体无差别 

3. 由两样本均数的差别推断两总体均数的差别，其差别有统计学意义指的是 （） 

A. 两样本均数的差别具有实际意义 

B. 两总体均数的差别具有实际意义 

C. 两样本和两总体均数的差别都具有实际意义 

D. 有理由认为两样本均数有差别 

E. 有理由认为两总体均数有差别 

4. 两样本均数比较，差别有统计学意义时， i 5 值越小说明 （） 

A. 两样本均数差别越大 B. 两总体均数差别越大 

C. 越有理由认为两样本均数不同 D. 越有理由认为两总体均数不同 

E. 越有理由认为两样本均数相同 

5. 假设检验中的 n 类错误指的是 （） 


B. 可能出现的假阳性错误 


笔记 





D. 可能出现的原假设错误 


a 可能出现的假阴性错误 
E. 可能出现的备择假设错误 

6. 减小假设检验的 n 类错误，应该使用的方法是 （） 

A. 减小I类错误 B. 减小测量的系统误差 

G. 减小测量的随机误差 D. 提高检验界值 

E. 增加样本量 

7. 以下不能用配对/检验方法的是 （） 

A. 比较15名肝癌患者癌组织和癌旁组织中 Sirtl 基因的表达量 

B. 比较两种检测方法测量15名肝癌患者癌组织中 Sirtl 基因的表达量 

C. 比较早期和晚期肝癌患者各15例癌组织中 Sirtl 基因的表达量 

D. 比较糖尿病患者经某种药物治疗前后糖化血红蛋白的变化 

E. 比较15名受试者针刺檀中穴前后的痛阈值 

8. 两独立样本均数 r 检验，其前提要求是（ ） 

A. 两总体均数相等 B. 两总体均数不等 

C. 两总体方差相等 D. 两总体方差不等 

E. 两总体均数和方差都相等 

9. 若将配对设计的数据进行两独立样本均数/检验，容易出现的问题是 （） 

I a . 增加出现I类错误的概率 b . 增加出现 n 错误的概率 

G. 检验结果的尸值不准 D. 方差齐性检验的结果不准 

E. 不满足/检验的应用条件 

10. 两组定量资料比较，当方差不齐时，应该使用的检验方法是（ ) 

A. 配对 Z 检验 B. Satterthwaite〆 检验 

C. 两独立样本均数/检验 方差齐性检验 

E. z 检验 

二、计算与分析 

1. 已知正常成年男子血红蛋白均值为 140 g / L ， 今随机调查某厂成年男子30人，测其 
血红蛋白均值为 125 g / L , 标准差 15 g / L 3 问该厂成年男子血红蛋白均值与一般成年男子是 
否不同？ 

2. 某研究者为比较耳垂血和手指血的白细胞数，调查12名成年人，同时采取耳垂血 
和手指血见下表，试比较两者的白细胞数有无不同。 


成人耳垂血和手指血白细胞数 （x 10g/L) 


手指血 

4.6 

4.2 

7.5 

7.0 

53 

10.3 


3. 分别测得15名健康人和13名 DI 度肺气肿病人痰中 ct, 抗胰蛋白酶含量 （g/L) 如下 
表，问健康人与 ID 度肺气肿病人 a, 抗胰蛋白酶含量是否不同？ 




健康人与 DI 度肺气肿患者 or, 抗胰蛋白酶含量 (g/L) 



in 度肺气肿患者~~ 

3.6 

3.4 

3.7 

5.4 

3.6 

6.8 

4.7 
2.9 
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4. 将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验，测得稀释倍数如下 
表，问两组的平均效价有无差别？ 

钩端螺旋体病患者凝溶试验的稀释倍数 __ 

标准株 100 200 400 400 400 400 800 1600 1600 1600 3200 3200 3200 

水生株 100 100 100 200 200 200 200 400 400 800 1600 _ 

5. 为比较男、女大学生的血清谷胱甘肽过氧化物酶 （GSH-Px) 的活力是否相同，某医 
生从某大学18〜22岁大学生中随机抽查男生48名、女生46名，测定其血清谷胱甘肽过氧 
化酶含量（活力单位），男、女性的均数分别为 96.53 和93.73,男、女性标准差分别为 7.66 和 
14.97。问男女性的 GSH-Px 是否相同？ 
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上一章介绍了两个样本均数比较的 Z 检验，而对于多于两组 (A>2) 样本均数的比较，《检验 
，方差分析( analysis of variance, ANOVA )则是解决上述问题的重要分析方法。方差分 
析由 R.A.Fisher( 1923) 首先提出，故又称为 F 检骑，其基本思想是将全部观测值的总变异按影 
响因素分解为相应的若干部分变异，在此基础上，计算假设检验的统计量 F 值，实现对总体均 
数是否有差别的推断。 

第一节完全随机设计的方差分析 

完全随机设计 (completely randomized design), 是一种将实验对象随机分配到不同处理组 
的单因素设计方法。该设计只考察一个处理因素，通过对该因素不同水平组间均值的比较，推 
断该处理因^不同水平之间的差异是否具有统计学意义。完全随机设计的数据结构一般形式 
如表 8-1 所示，其中 i: 为处理因素的水平数.为处理因 素第； 水平的第 J 个观测值， 《,(; = 1, 
2, …， i) 为处理因素第 / 水平组的观测例数,》为总例数,无为处理因素第； 7JC 平组的均数，X为 
总均数，耷为处理因 素第； 水平组的方差, S 2 为全部观测值的方差。 

| _表 8-1 完全随机设计方差分析的数据结构 




处理因素 



~ 水平 1 

水平 2 

… 水平 / - 

• 水平 /c 


X u 


… X n - 

. x kl 



Xn 

… Xa • 

- AT« 




… x u • 

. ^ 


-- ^ 


… Xu , • 




”2 


«* 

n 


X 2 

i • 


X 


资 _ s[ _ S? _^_ S? _ .二 _ si _ s^_ 


表 8-1 中， n 个观测值彼此不同，可以用方差来反映其变异程度。方差的分子部分为《个观 
测值的离均差平方和，称为总变异(记为 SSe ), 对此可以作如下分解： 
ss & = - J) 2 = [CA-, - +OC,-X'>7 

其中 

故 

f ss &=!：«,«;- « 2+ 

70 
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其中，|^/7,.(无-无) 2 称为组间变异，记为55组* 1 ，反映了处理因素各个水平组间的差异，同时也 
包含了随机误差名 ljc^ -无) 2 称为组内变异，记为 SS 触， 反映了各组内样本的随机波动。 

. 由此可见，总变异见总可以分解为组间变异 SS aR | 和组内变异 SSjm , 即 

SS 组两+ SS 组内 (8-1) 

其中，总变异自由度V总=/2- 1，组间变异自由度 V m = k~l, 组内变异自由度=17 -灸。对于自由 
度，同样有 

h=v 组间 +v 粗内 （8-2) 

上述各部分变异除以相应自由度得到相应平均变异，即方差(通常称均方)。组间均方为 

^»r,=^ = ^f (8-3) 

组内(误差)均方为 

= ^ (8-4) 

检验各处理组均值之间有无差异这一假设可以通过比较来实现。与^ a 内 | 
之比即构成了方差分析的统计量，即 

% ㈣ 

可以证明，当原 假设执 成立时，统计量 f 服从自由度为 u-i， w -it) 的尸分布。尸值接近 
1，可认为均值的差异只源于随机波动，而非处理因素 作用； F 值大于1 ^rKF>F a(t . l , n - kh P<a, 
则按 oc 水准拒绝//。，表明有随机波动之外的处理因素造成了均值的差异。 

以上计算过程可用完全随机设计方差分析表(表 8-2) 进行概括。 


表 8-2 完全随机设计的方差分析表 


变异来源 

平方和 （SS) 自由度 U) 

均方 (MS) 尸值 

总变异 

SSm = ~~ 尤) 2 = (w-l)5 2 v -总:”- 1 


处理组间 



组内（误差） 

注：方 差分析 

姐内总一 <ss ■组间 v 组内二^总-卩组问 

表中 自由度V 常以表示 

1七 


例 8-1 在评价某药物耐受性及安全性的I期临床试验中，将符合纳入标准的30名健康自 
愿者随机分为3组，每组10名，各组注射剂量分别为 0.5U、1U、2U, 观察48小时部分凝血活酶 
时间 (s), 结果见表8-3。试问不同剂量组的部分凝血活酶时间有无不同？ 

方差分析具体 步骤： 

( 1 ) 提出检验假设，确定检验水准 

Ho ••卩I =处=内，即三个组部分凝血活酶时间的总体均数相同 

H ':h，fh，th 不全相同，即三个组部分凝血活酶时间的总体均数不全相同 





表 8-3 三种不同剂量组48小时部分凝血活酶时间 （s) 


0.5U 


1U 

40.0 


2U 

32.9 


合计 


34.4 

34.3 

35.7 

33.2 

31.1 


34.3 33.4 

29.8 38.3 

35.4 38.4 

_ 3L2 _ 39.8 

n t 10 10 

33.62 37.83 

_Si _ 2.2636 _ 2.2071 


30(”） 

35.5167(D 

3.1072(5) 


⑵计算检验统计 量尸值 

SS & = Cn- V)S 2 = (30 -D x 3.1072 2 =279.9861 
v 总 =30-1 = 29 

=10x(33.62-35.5167) 2 + 10x (37.83 -35.5167) 2 +10 x (35.10 -35.5167) 2 
= 91.2247 


^A = ^ = 45. 61 24 

V 组间 L 

■SS 组内 = 55 总一 *ss ■组间 = 279.9861-91.2247 =188.7614 

v 组内 =v f v _ = 29 - 2 = 27 

怒组内 188.7614 


MS 组内 =. 


v sirt 


= 6.9912 


将上述计算结果列于表 8*4 的方差分析表中。 



表8~4 

完全随机设计的方差分析表 



变异来源 

SS 

V 

MS 

F 

P 

总变异 

279.9861 

29 




处理组间 

91.2247 

2 

45.6124 

6.52 

<0.05 

组内(误差） 

188.7614 

27 

6.9912 

_ 



(3) 确定 Z 5 值，做出推断结论 

分子自由度 v 组间= 2 ， 分母自由度 v 组内= 27 ， 査 F 界值表 （ 方差分析用 ） ，因厂 界值表中无 
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V组内= 27, 取 V组内 = 26， F 0 .o S(2 , 26) =2.52 。 由于/，从而/ ><0.05, 按照 ot = 0.05 的检验水 I 
准拒绝//。，可以认为三种不同剂量48小时部分凝血活酶时间不全相同。 

第二节随机区组设计的方差分析 


随机区组设计 (randomized block design) 又称为配伍组设计，其做法是先将受试对象按条 
件相同或相近组成 m 个区组(或称配伍组),每个区组中有 /t 个受试对象，再将其随机地分到灸 
个处理组中。随机区组设计在 m 个区组和 A 个处理水平组构成 wit 个格子，每个格子仅一个数 
据馮 (卜 1,2,3,..., 幻户1，2, 3,…， m), 其方差分析属无重复数据的两因素方差分析 (two-way 
AN0VA), 数据结构如表 8-5 所示。 


表 8-5 随机区组设计方差分析的数据结构 


区组 （B) 


处理因素 (A) 


水平1 

水平2 … 

水平 /f 

区组1 


晁 … 

X kx 

区组2 

Xn 

X n … 

Xn 

区组 m 

AT Im 

4 … 



与完全随机设计方差分析情况类似，总变异 •SSs 可分解为处理组的变异 SS 瓶 、区组的变异 
以及随机误差即 

SS^SS^+SS^+SS^ (8-6) 

相应的自由度有 

v .s =v 4ta +v Kffl+v^ (8-7) 

式 (8-6) 中的各项计算与完全随机设计的方差分析相同，只需要另外 计算货 区组 ，即 

SS^f^kiX.-Xy (8-8) 

其中，文 7 •为各区组的均数，讲和 A: 分别为区组和处理的水平数。上述计算公式归纳在方差分析 
表中(见表8-6)。需要注意的是，由于公式中使用了处理组间和区组间的均数(传统方法是求和 
计算)，手工计算可能岀现较大的误差,实际应用中最好采用统计软件进行计算。 

_ 表 8-6 随机区组设计的方 差分析表_ 

变异来源 平方和 (SS) 自由度 (y) 均方 (MS) / 

总变异 ^ = = V A = W -1 

处理间 SS^ = ~^ 2 v tta =*-i F aa = 二: 

区组间 SS &ta = Y^k(.Xj- X) 2 v KSa =m-l MS RtR - = 泌 :: 


可以看出，与完全随机设计相比，随机区组设计方差分析将总变异分解为三部分，即除处理 
组间变异之外，还将区组因素导致的变异也分离出来，从而减少了随机误差，提高了实验效率。 
例 8-2 为探讨 Rgl 对镉诱导大鼠睾丸损伤的保护作用，研究者按照窝别把大鼠分成10个 


笔记 





■ 
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区组，然后将同一区组内的3只大鼠随机地分配到三个实验组，分别给与不同处理，一定时间后 
测量大鼠的睾丸 MT 含量 (ng/g), 数据如表 8-7 所示。 试比较三种不同处理对大鼠 MT 含量有无 
差别？ 

表 8-7 三组大鼠 MT 含量值 (jjg/g) 


窝别 

对照组 

氣化镉组 

Rgl + 氣化镉组 

X, 

1 

40.6 

78.3 

116.3 

78.4000 

2 

44.8 

86.0 

124.6 

85.1333 

3 

36.7 

72.1 

149.0 

85.9333 

4 

49.9 

95.4 

128.8 

91.3667 

5 

59.8 

99.2 

134.1 

97.7000 

6 

54.5 

95.9 

133.0 

94.4667 

7 

38.4 

76.4 

115.6 

76.8000 

8 

41.6 

79.9 

117.0 

79.5000 

9 

46.8 

86.5 

128.4 

87.2333 

10 

44.7 

85.3 

124.3 

84.7667 

X 

45.78 

85.50 

127.11 

86.13(^) 


方差分析步骤如下： 

( 1 ) 建立检验假设，确定检验水准 
^0：//1=// 2 =// 3 ,即三组大鼠 MT 含量的总体均值相同 

H': 不全相等，即三组大鼠 MT 含量的总体均值不全相同 

a=0.05 

(2) 计算检验统计 量尸值 
5 2 = 1214.705 62 

SS & = 5 2 («-1) = 1214.705 62x(30-1) =35 226.4630 
怒細=|>(无-无) 2 

= 10x(45.7800 —86.1300) 2 + 10x(85.5000-86.1300) 2 + 10x(127.1 100 -86.1300) 2 
= 33 078.7980 
ss^^kOCj-xy 

= 3x(78.4000-86.1300) 2 +3x(85.1333-86.1300) 2 + … +3x(84.7667 -86.1300) 2 
« 1276.9630 

55 ■误笼 = *55 总一* SS 处理 -SS 区组 = 35226.463-33 078.7980-1276.9630 = 870.7020 
将上述计算结果列于表 8-8 的方差分析表中。 

表 8-8 随机区组设计的方差分析表 

变异来源 SS v _ MS_ _ 尸值 

总变异 35226.4630 29 

处理组间 33078.7980 2 16539.3990 341.92 

区组间 1276.9630 9 141.8848 2.93 

笔记 y 麟 870.7020 18 _ 48.3723 _ 







对于处理因素，根据分子的自由度和分母的自由度，按照 a = 0.05 的显著性水准 ，查 F 界 
值表 ( 方差分析用), Fo . 05 (2..8)=3.55 ;由于尸= 341.92,F>F 0 .05(2..8)， 故 P <0.05, 差别具有统计学 
意义(拒绝 H 0 ), 可认为三组大鼠 MT 含量的总体均数不同，即不同处理对大鼠 MT 含量有影响。 
同理，可以看出不同窝别大鼠的 MT 含量不同(尸<0.05)。 


第三节多个样本均数的两两比较 

根据方差分析的结果,若拒绝私、接受//,，则可以 推断々 组均数不全相同，然而，究竟哪些 
组不同，需要进一步对多个样本均数进行两两比较或称多重比较 (multiple comparison) 0 对此若 

用上一章学习的 r 检验对*组均数进行两两比较，共需比较次，如需要进 

行10次比较，若规定检验水准 a = 0.05, 在原假设//。成立的条件下，10次检验均不犯I类错误 
的概率为0.95'°=0.5987,累积犯I类错误的概率为 1-0.5987=0.4013, 明显大于0.05。因此，均 
数间的多重比较不能直接使用两均数比较的/检验。 

多重比较的方法有很多，如 DunnetW 检验、 LSD-f 检验、 SNK •以 Student-Newman-Keuls) 法、 
Tukey 法、 Sch6ffe 法、 Bonferroni t 检验和 Sidak/ 检验等。各种方法的适用范围参见表8-9。 


表 8-9 多个样本均数两两比较方法选择策略__ 

选择方法 ：⑨巧 n : 适用范围 

DunnetW 检验 多个试验组与一个对照组均数差别的比较。 

LSD-? 检验 多个组中，根据专业，仅进行某一对或某几对在专业上有特殊探索价值的均数间的 

两两比较。 

sm-q 检验 任意两两组间均数均进行比较，各比较组样本含量可不相等。 

Tukey 法 任意两两组间均数均进行比较，要求各比较组样本含量 相同。 

Sch6ffe 法 既可以进行因素水平的平均效应的比较，还可比较因素水平平均效应的线性组合， 

多用于对比组样本含量不等的资料。 

Sidak/ 检验 两两比较时检验水准调整为 aV=l - 为方差分析原检验水准， w 为两两比 

较次数)，以使多次比较犯I类错误的概率控制 a 以内的均数间两两比较。 

BonfemmW 检验将两两比较吋检验水准调整为以(《，=兰),以使多次比较犯I类错误的概率控制《以 
_ 内的均数间两两比较，是 Sidak f 检验的近似。 ___ 

下面以比较常用的 SNK 法为例，说明两两比较方法的具体应用。 

SNK 法的检验统计量为《，故又称为 9 检验。其计算公式为 

(8-9) 


式中，足 、兄分 别为任意两个对比组的样本均数，分母为两组均数之差的标准误，〜、叫为相应 
的两个对比组的样本例数，为方差分析中的误差均方。 

例 8-3 对例 8-1 中不同注射剂量组受试者部分凝血活酶时间的均数作两两比较。 

( 1 ) 提出检验假设，确定检验水准 

H 0 ： 即任意两组的部分凝血活酶时间的总体均数相等 

^u B , 即各组部分凝血活酶时间的总体均数不等或不全相等 




m 
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(2) 计算检验统计量《值 

首先将三个样本均数由大到小排序，并 编组： 

原组别 1U 2U 0.5U 

均数 37.83 35.10 33.62 

组次 1 2 3 

三组均数共需做〔;)= 2 !( 3 3 丄 2 )! = 3次两两比较。 

组次1与组次3 比较： 

MS 贼=6.9912, =37.8300, ^=33.6200, /i, = 10, « 3 = 10 



其余类推,可以得到组次1与组次2、组次2与组次3比较的 g 值，检验的尸值可以通过査 
附表5得到，将所有计算结果与 如 界值列于表8-10。需要 注意： 如果组次1与组次3比较 
结果/>>«,后面就不需要进行检验，直接判 定为尸 >«。 

表 8-10 例 8-3 的 SNK 法两两比较计算表 


对比组/\与8 

X.-Xa 

q 值 

组数 a 

go.05(cr.27) 界值 

P 值 

组次1与3 

4.21 

5.04 

3 

3.52 

<0.05 

组次1与2 

2.73 

3.27 

2 

2.91 

<0.05 

组次2与3 

1.48 

1.77 

2 

2.91 

>0.05 


注 :本例 v m =21,q 界值表中无此自由度下临界值，故采用内插值法计算相应的9界值 

(3) 确定/>值，做出推断结论 

以误差(组内）自由度和对比组包含的组数《查0界值表， 经查表，若9 值大于或等于分界 
I值，则可以推断比较的两组间差别有统计学意义，否则差别无统计学意义。由表 8-10 可知， 1U 
与 2U 组、 1U 与 0.5U 组比较时， P<0.05 ，拒绝7/。,差别有统计学意义，而 2U 组与 0.5U 组之间的 
差别无统计学意义。 

第四节方差齐性检验 

方差分析有其应用条件,理论上要求各样本相互独立，服从正态分布且方差齐同。相对而言， 

1 方差是否齐同对检验的准确性影响更大些。多组数据的方差齐性检验,应用较多的是 Bartlett 检 
| 验法和 Levene 检验法。 Bartlett 检验法主要适用于正态分布资料的方差齐性检验问题，如资料 
不服从正态分布，则可采用 Levene 检验法。以下仅介绍 Bartlett 检验法，对于 Levene 检验法，有 
兴趣的读者可参考有关书籍。 

对于 Bartlett 检验法,其检验统计量为 

X 2 = ~- 9 v = k-l (8-10) 

其中 

笔记01 = 11(«,-1)111(5 6 2 /5, 2 ) (8-11) 
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上述式中，犮 为第 i 组的方差，圮为合并方差(对完全随机设计资料有 S 卜 MS 綠)， 々为比较组 i 
数， 叫为第 /组样本例数，《为总例数。 

当样本来自独立正态总体时，在好 。： <=-为真情况下，该检验统计量服从丨 

v=/t-l 的/分布。样本方差犮差异越大, 越大，/值亦越大。如果，拒绝 | 
H 01 可认为方差 不齐; 反之,若 则户 >«,不拒绝//。，尚不能认为方差不齐。 

例 8-4 对例 8-1 资料作方差齐性 检验。 

( 1 ) 提出检验假设,确定检验水准 
H ,, c \ = a \ = ol 即三个总体方差相等 
环 A 2 ,4，a 3 2 不全相等 

« = 0.10 

(2) 计算检验统计量/值 
本例： 


灸=3, w,=w 2 =” 3 = 10, w=30 
5, = 2.2636, 吴 =2.2071 ，5 3 = 3.3133 
MS 误差 =6.9912 
e,=2(»,-l)lnCS c 2 /5, 2 ) 

二純 黑秦純鐵 

= 1.9872 

a=I+ Mtb)(S^T _ dr) 

=1+ 5^o^ x (il + To^T + I^"35^) 

= 1.0494 

/=| = SS =l . 89 ’ v + i=2 


(3) 确定 P 值，做出推断结论 

自由度 v = 2, 査/ 界值表，； d, 0.2=4.61。由于/= 1.89，/</ 0 ., 0 . 2 ,故 / > >0.10,按照 « = 0.10 
的检验水准，不拒绝风，尚不能认为三个总体方差不齐。 


第五节其他设计类型的方差分析 


一、析因设计 

析因设计 (factorial design) 是一种多因素多水平交叉组合的实验设计方法。在医学研究中’ 
如果涉及两个或多个处理因素，而研究者希望了解各处理因素的效应以及因素间的交互作用 
时，则可以采用析因设计方法。这里只介绍具有2个处理因素、每个因素有2个水平，即所谓的 
2x2 析因设计的方差分析。 

假设有 A 和 B 两个因素，因素 A 的2个水平分别用4、木表示，因素 B 的2个水平分别用 
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怂、馬表示，共有四种不同的 组合。 现在每种组合下各进行了 r 个观测，七 t 表示在 J 為条件下 
的第个观测数据，其数据结构见表8-11。 

表 8-11 2x2 析因设计的数据格式 


_^2 •^211»不12».“，不 1， _ , Xi2 , _ 

2x2 析因设计方差分析的目的是考察 A、B 两因素主效应及两因素间的交互作用。什么是 
“主效应”与“交互作用”，以及如何进行方差分析,通过下面实例加以说明。 

例 8-5 在一项动物实验研究中，将40只雌性小鼠做成哮喘动物模型，然后随机分为4组， 
接受 A 和 B 两种药物不同组合的处理，即 A x B x . A x B ^ A 2 B x , A 2 B 2 , 检测小鼠支气管肺泡灌洗液 
(BAFL 冲的 IL>4( P g/ml) 水平，观测结果见表8-12。 

_ 表 8-12 小鼠 BALF 中 IL4 值 (pg/ml) 









B2 


A 

37.43 

35.04 

32.02 

33.30 

37.94 

39.21 

39.58 

39.77 


36.83 

36.88 

30.58 

38.19 

33.63 

32.62 

43.50 

27.41 


36.32 

36.60 



39.30 

46.43 



a 2 

3(X57 

36*27 

37.76 

30.63 

45.11 

54.15 

51.61 

52.45 


35.95 

33.95 

29.69 

36.06 

46.77 

47.66 

54.99 

50.65 


32.44 

34.69 



42.71 

48.60 



为便于说明，将表 8-12 数据的均数整理成表8-13。 







表 8-13 例 8-5 资料 IL-4 值均数整理表 



A 因素 



B 因素 





B2-B' 


By 


B2 




A x 


35.32 


37.94 


36.63 


2.62 

_ 


33.80 


49.47 


41.64 


15.67 

均数 


34.56 


43.71 


39.14 


9.15 



-1.52 


11.53 

_ 

5.01 




1. 单独效应单独效应 (simple effect) 指其他因素水平固定在一个水平时，某一因素不同 
水平之间均数的差别。如当 A 因素固定在4水平时， B 因素的单独效应为 2.62; 当 A 因素固定 
在為水平时， B 因素的单独效应为15.67。同理， B 因素固定在5,水平时， A 因素的单独效应 
为 -1.52; B 因素固定在5 2 水平时， A 因素的单独效应为11.53。 

2- 主效应主效应 (main effect) 是指某一因素各个水平间的平均差别。如 A 因素的主效应 
记为毛，则不 =41.64-36.63 = 5.01; 同理， B 因素的主效应； =43.71 -34.56 = 9.15。 

3 - 交互效应如果一个因素的单独效应随另一因素的水平变化而变化，而且其变化幅度 
| 不能用随机误差解释时，则称这两个因素间存在交互效应 (interaction effect)。 如对于 fi〗 水平， A 
I 因素的单独效应为 -1.52； 而对于5 2 水平， A 因素的单独效应为 11.53, 这说明 A 因素与 B 因素 

的效应互不独立， A 因素单独效应依赖于 B 因素水平的选择，即 A 因素与 B 因素之间存在交互 
效应，记为;^。 
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4. 方差分析按照方差分析基本思想，析因设计中，观测值总变异怒. & 可分解为以下四个 
部分： 

SS & = SS A + SS B + SS AB + SS 綠 (8-13) 

相应的自由度为 

v 总 svj+va+v 仙 (8-14) 


有关计算式归纳于表 8-14 的方差分析表中。其中，无为 A 因素第/水平的均数， 巧为 B 因 
素第水平的均数，^为 A 因素/水平、 B 因素 ） 水平组合下的均数， S 为总标准差， r 为各组合 
的重复观测例数。 


变异来源 

表 8-14 : 

平方和 SS 

2x2 析因设计方差 分析: 

自由度 v 

表 

均方 MS 

/= 值 

总变异 


v 总 =2x2xr-l 




= (2x2xr-l)S 2 




A 因素 

SS A ^Y J 2r(X i -X'> 2 

v，2-l 

MS a =SS a /v a 

。憂 

B 因素 

SS^j^lrUC.-X? 

v fl =2-l 

MS b =SS b /v b 

F - = ^ 

AB 因素 

SS M *=茲喷- 抒 -SS A -SS. V^,=(2-1 )(2-1) 

MS^SSab/vm 

J, MSab 

误差 

怒職 = SS 岛 - SS A —SS B —SSab 

、=^总-〜-矿1 

=2x2x( r -i) 




本例2 x 2析因设计的方差分析步骤 如下： 

(1) 提出检验假设，确定检验水准 

H 0 U )： Mx =// 2 ,即 A 因素两个不同水平的 IL4 测量结果相同 
况 U): 妁？ ，即 A 因素两个不同水平的 IL4 测量结果不同 
H olB) ： T, = r 2 ,8PB 因素两个不同水平的 IL~4 测量结果相同 
Hhb )： r# r2 ，即 B 因素两个不同水平的 IL~4 测量结果不同 
坪 )W ): A 与 B 无交互效应 
况(如: A 与 B 存在交互效应 
a = 0.05 

(2) 计算检验统计量 F 值 

按表 8-14 中的公式计算检验统计量。现使用 SPSS 统计软件进行计算，结果列于表 8-15 的 
方差分析 表中。 


表 8-15 2x2 析因设计方差分析表_ 

变异来源 平方和 SS 自由度 v 均方 MS 尸值 


总变异 


2055.1779 





(3) 确定尸值，做出推断结论 

査 F 界值表，对于 A 因素 F 0 .05(,.36)=4.11,K>F 0 .05 ( 丨 .如, P<0.05, 按照 a = 0.05 的检验水准拒 
绝 Houh 认为 A 组与為组 IL-4 值总体均数不相等。同理,对于 B 因素 F b >F 0 . 05(1 .36),P<0.05, 
拒绝组与 5 2 组 IL4 值总体均数不 相等； 对于 AB 交互作用， F^>Fo.o 5 (,.36), 尸 <0.05 ， 拒 
绝 H 0(AB)t A 与 B 两处理因素存在交互作用。 


二、重复测量设计 


重复测量设计 (repeated measurement design) 指同一受试对象的某一观察指标在不同时间点 
上进行多次测量的设计方法，如服用某种药物后测定不同时间点的血药浓度，接受治疗后在不 
同时间点上对某指标进行测量，这种设计方法在医学研究领域中有着广泛的应用，常用来分析 
不同处理在不同时间点上的变化情况。 

重复测量设计与随机区组设计有相似之处，但二者有实质性差异。在随机区组设计中，同 
—区组的每一受试对象随机分配，接受不同的 处理； 而对于重复测量设计，通常是对同一受试 
对象在各时间点进行测量，由于不同时间上的测量结果可能存在相关性，因此需要采用特殊的 
统计方法进行分析。 

例 8-6 将手术要求基本相同的15名患者随机分为3组，在手术过程中分别采用 A、B、C 三 
种麻醉诱导方法，在 r。 (诱导前)、 r, 、 r 2 、r 3 、r 4 五个时相测量患者的收缩压，数据记录见表8-16。 


表 8-16 不同麻醉诱导时相患者的收缩压 （mmHg) 


患者序号 诱导方法 


2 A 

t A 

4 A 

5 A 

6 B 

7 B 

8 B 

9 B 

10 B 

11 C 

12 C 

13 C 

14 C 

J5_C_ 


To 

120 

118 

119 

121 

127 
121 
122 

128 

117 

118 
131 
129 
123 
123 
125 



麻醉诱导时相 


12 

15 
19 
19 
27 
18 

19 
26 
11 

16 
18 
21 

20 
16 
18 



117 

123 

120 

126 

137 

133 

142 

131 

133 

129 

136 

126 

130 


该实例为两因素重复测量设计资料，其总变异包括两部分，一部分为受试对象间的变异， 
另一部分为受试对象内的变异。其中受试对象间的变异又分为处理因素(例 8-6 中的 A、B、C 三 
种麻醉诱导方法)的变异和个体间误差两部分，而受试对象内的变异则分为时间因素的变异、处 
理和时间的交互效应以及个体间误差三部分，总变异分解为 
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重复测量设计资料的方差分析计算较为复杂,一般采用统计软件包完成，在此不给出具体 
计算 过程。 本例使用统计软件(如 SPSS) 进行计算，现将计算结果列于表 8-17 的方差分析 表中。 


表 8-17 重复测量方差分析表 


变异来源 

SS 

v MS 

F 

P 

受试对象间处理 

912.24 

2 456.12 

5.78 

0.0174 

个体间差异 

946.48 

12 78.87 



受试对象内时间 

2336.45 

4 584.11 

106.56 

<0.0001 

处理X时间 

837.63 

8 104.70 

19.10 

<0.0001 

个体内误差 

263.12 

48 5.48 



结果 显示： F 4tfl , = 5.78,P=0.0174, 尸<0.05,按 a=0.05 的检验水准拒绝风，认为不同处理组 

之间的差异有统计学意义。同理,对于麻醉诱导时相时间，= 106.56, P<0.0001 ，按《 = 0.05 

的检验水准拒绝说明不同时间点之间的差异有统计学 意义; 处理与时间的交互作用的方差 

分析,厂处@,_ = 19.1，戶 <0.0 

001，按 a=0.05 的检验水准拒 绝风， 说明时间与处理的交互作用有 

统计学意义。 






练习题 

_、单项选择题 

1. 方差分析的基本思想是（ ） 

A. 组间均方大于组内均方 B. 组内均方大于组间均方 

C. 不同来源的方差必须相等 D. 两方差之比服从 F 分布 

E. 总变异及其自由度可按不同来源分解 

2. 方差分析的应用条件之一是方差齐性，它是指（ ) 

A. 各比较组相应的样本方差相等 B. 各比较组相应的总体方差相等 

C. 组内方差等于组间方差 D. 总方差等于各组方差之和 

E. 总方差=组内方差+组间方差 

3. 完全随机设计方差分析中的组间均方反映的是 （ > 

A. 随机测量误差大小 B. 某因素效应大小 

C. 处理因素效应与随机误差综合结果 D. 全部数据的离散度 

E. 各组方差的平均水平 

4. 对于两组资料的比较，方差分析与/检验的关系是 （） 

A. /检验结果更准确 B. 方差分析结果更准确 

C. /检验对数据的要求更为严格 D. 近似等价 

E. 完全等价 

5. 多组均数比较的方差分析，如果 /^O.OS， 则应该进一步做的是 （） 

A. 两均数的/检验 B. 区组方差分析 

C. 方差齐性检验 D. SNK-9 检验 

E. 确定单独效应 

6. 完全随机设计的多个样本均数比较，经方差分析，若/><0.05,则结论为（ ） 

A. 各样本均数全相等 B. 各样本均数全不相等 
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C. 至少有两个样本均数不等 D. 至少有两个总体均数不等 

E. 各总体均数全相等 

7. 完全随机设计资料的多个样本均数的比较，若处理无作用，则方差分析的 F 值在理论上 
应接近于（ ） 

A. F aiVitVj) B. SStt 攻 /SS 条左 

C. 0 D. 1 

E. 任意值 

8. 对于多个方差的齐性检验，若尸<«,可认为 （） 

A. 多个样本方差全不相等 B. 多个总体方差全不相等 

C. 多个样本方差不全相等 D. 多个总体方差不全相等 

E. 多个总体方差相等 

9. 析因设计的方差分析中，两因素义与 F 具有交互作用指的是 （） 

A. I和 : K 的主效应互相影响 B. 尤与 y 对观测指标的影响相差较大 

c. x 与 y 有叠加作用 d. 尤对观测指标的作用受 y 水平的影响 

E. X与 F 的联合作用较大 

10. 某职业病防治院测定了年龄相近的45名男性用力肺活量，其中石棉肺患者、石棉 
肺可疑患者和正常人各15名，其用力肺活量分别为 （1.7 9 土 0- 74 )L、（ 2 . 3 l±0. 87 )L 和 
(3.08±0.65)L, 拟推断石棉肺患者、石棉肺可疑患者和正常人的用力肺活量是否不同， 
宜采用的假设检验方法是 （） 

A. 两组均数比较的/检验 B. 方差齐性检验 

C. 完全随机设计方差分析 D. 随机区组设计方差分析 

E. 析因设计方差分析 
二、计算与分析 

1. 某实验室研究人员检测了三种病情慢性乙型肝炎患者血清 sFasL 水平，试比较不同 
病情乙型肝炎患者 sFasL 水平是否不同？ 


慢性乙型肝炎及献血员血清 sFasL 水平 （M9/D 


重度慢性乙型肝炎 

中度慢性乙型肝炎 

轻度慢性乙型肝炎 

1.54 

0.88 

0.18 

1.52 

0.91 

0.31 

1.61 

0.88 

0,21 

1.62 

0.82 

0.17 

1.48 

0.89 

0.30 

1.67 

0.92 

0.21 

1.41 

0.97 

0.34 

1.57 

0.72 

0.24 

1.64 

0.98 

0.19 

1.50 

0.98 

0.19 

1.74 

0.77 

0.23 



0.20 



0.31 
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2. 为^■讨小剂量地塞米松对急性肺损伤动物模型肺脏的保护作用，将 36 只二级 SD 
大鼠按性别、体重配成12个配伍组，每一配伍组的3只大鼠被随机分配到对照组、损伤组 
与激素组，实验24小时后测量支气管肺泡灌洗液总蛋白水平 （g/L), 结果如下表。问3组 
大鼠的总蛋白水平是否不同？ 

3组大鼠总蛋白水平 (g/L) 

配伍组 

对照组 

损伤组 

激素组 

1 

0.36 

1.48 

0.30 

2 

0.28 

1.42 

0.32 

3 

0.26 

1.33 

0.29 

4 

0.25 

1.48 

0.16 

5 

0.36 

1.26 

0.35 

6 

0.31 

1.53 

0.43 

7 

0.33 

1.40 

0.31 

8 

0.28 

1.30 

0.13 

9 

0.35 

1.58 

0.33 

10 

0.41 

1.24 

0.32 

11 

0.49 

1.47 

0.26 

12 

0.27 

1.32 

0.26 

3. 为研究查淋酸对大鼠急性和亚急性炎症的影响，将40只体重为 200±20(g) 的雄性 

Wistar 大鼠建立急性和亚急性炎症动物模型，然后随机分为四组，每组10只，给予不同的处 

理，观察其 WBC 值。四种处理分 别为： 腹腔注射生理盐水后3小时处死、腹腔注射生理盐 

水后6小时处死、腹腔注射喹啉酸 (0.35mg/g) 后3小时处死、腹腔注射喹啉酸 (0.35mg/g) 

后6小时处死。实验结果如下表。问喹啉酸及作用时间对 ^WBC 值是否有影响？ 


不同药物与不同时间大鼠 WBC 值 



生理盐水 

喹啉酸 


3小时 

6小时 

3小时 

6小时 

21.3 

19.0 

15.8 

13.9 

21.9 

25.2 

8.7 

15.8 

11.1 

22.9 

9.4 

18.3 

16.3 

19.8 

5.3 

13.0 

17.9 

22.7 

8.3 

14.0 

18.8 

23.0 

11.0 

19.0 

13.5 

22.8 

12.8 

15.3 

22.6 

17.8 

12.5 

19.2 

17.1 

24.6 

9.3 

18.2 

14.6 

25.3 

11.0 

17.3 
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/检验 (chi-square test) 是英国统计学家 Pearson 提出的一种主要用于分析分类变量数据的 
假设检验方法，该方法主要目的是推断两个或多个总体率或构成比之间有无差别。 

第一节四格表资料的/检验 

例 9-1 为了解吲达帕胺片治疗原发性高血压的疗效，将70名高血压患者随机分为两组， 
试验组用吲达帕胺片加辅助治疗，对照组用安慰剂加辅助治疗，观察结果见表 9-1 ，试分析吲达 
帕胺片治疗原发性高血压的有效性。 

__ 表 9-1 两种疗法治疗原发性高血压的疗效 _ 

厂组别 有效 无效 合计 有效率（％> 一 

对照组 20(25.8)0 24(18.2)6 AA(a + b) 45.45 

试验组 21( m)c _ 5C10.8)rf _ 26(e+d) _ 80 .” _ 

_ 41(a+c) _ 29(. b+d) _70( w)_ 58 . 57 _ 

本例为两样本率比较的资料，表 9-1 中的数字 a，b， c，d 是该表的四个基本数据，进而可以 
计算出各行列周边的合计数和两组的有效率，对此称之为四格表 (fourfold table) 资料。四格表 
资料可以用/检验推断两个总体率之间有无差别。 

一、 /检验的通用公式 
/检验的检验统计量为其通用的基本公式为 

/ = v =( 行数 - 1 )( 列数 - 1 ) (9-1) 

式中， d 为实际频数 (actual frequency), r 为理论频数 （theoretical frequency ), V为自由度。式 
(9-1) 服从自由度为分布。 

对于四格表资料，理论频数 r 根据检验假设风:々=巧确定。如例 9-1 的无效假设是试验 
组与对照组治疗原发性高血压的总体有效率相等，可以将两组合计的有效率 ( 58 . 57 % ) 作为各 
组的有效率。按照这一假设，理论上对照组44例原发性高血压病患者中的理论有效人数应为 
(44x41 )/70 = 25.77, 无效人数为 ( 44 x 29 )/70 = 18.23 ;同理，试验组的加例原发性高血压病患 
者中的理论有效人数为 (26M1)/70=15.23, 无效人数为 （26 x 29 )/70=10.77。计算理论频数7 1 
的公式为 

r (9-2) 

u n 

式中7；为第/行第 J 列的理论频数 ，〜和 •分别为相应行与列的周边合计 数，” 为总例数。 

由式 (9-1) 可以看出，/值反映了实际频数与理论频数的吻合程度。若检验假设/4成立， 
实际频数与理论频数的差值应该较小，即/值也应该 较小； 反之，若检验假设私不成立，实际 
频数与理论频数就会相差较大，则/值也会较大。/值的大小也取决于 (J _门 2 / r 的个数多少 
(自由度 v 的大小)。由于各 u-r) 2 /r 皆为正值，故自由度 v 愈大,/值也会愈大；所以只有考 
虑了自由度 v 的影响，/值才能正确地反映实际频数 j 和理论频数 r 的吻合程度。 
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四格表资料只有两行两列，在周边合计数固定的情况下，四个基本数据当中只有一个数据 
可以自由取值 (v= 1 ), 因此，对于四格表资料，只要根据式 (9-2) 计算出一个理论值7；•后，其他 
三个理论值可用周边合计数减去相应的理论值 r 得出。如例 9-1 中 ，r„=(44 x 41)/70 = 25.8, 
r, 2 = 44 - 25.8= 18.2, r 2 , =41 -25.8 = 15.2, r M =26-15.2=10.8( 或 r：2=29-18.2 = 10.8)。 

/检验时，要根据自由度 v 査; f 2 界值表。当自由度 v 确定后,/分布曲线下右侧尾部的面 
积为《时，横轴上相应的; f 2 值记作 / a . v ，即/分布的分位数。/值与尸值的对应关系见/分布 
界值表。由/分布界值表可知，在自由度V确定后,/ 值愈大， P 值愈小；反之，/值愈小，尸值 
愈大。若检验水准为《 ，当; 时,/>知，拒绝//。，接受当时，不拒绝％。 
现以例 9-1 为例说明/检验的步骤。 

( 1 ) 建立检验假设并确定检验水准 

Ho： 7r, = 7r 2 , 即试验组与对照组的总体有效率相等 
H r .7i:^7c 2 , 即试验组与对照组的总体有效率不等 
a = 0.05 

(2) 计算检验统计量 

按式 (9-2) 计算，然后利用四格表的各行列的合计数计算 r 12 、r 2 ，和 r 22 ，即 
r" =(44 x 41 )/70= 25.77, r,2=44 - 25.77= 18.23 
T 2l =41 -25.77= 15.23, r 22 =26-15.23= 10.77 

按公式 (9-1) 计算 / 值 

2 (20-25.77) 2 (24-18.23) 2 (21-15.23) 2 (5-10.77) 2 0 
25.77 18.23 15.23 10.77 

v=(2-1)x(2-1)=1 

(3) 确定 P 值，作出推断结论 

以 v= 1查附表7的/分布界值表，得尸<0.005。按《 = 0.05水准，拒绝风，接受仏，可以 
认为两组治疗原发性高血压的总体有效率不等，即可认为吲达帕胺片治疗原发性高血压是有 
效的。 


二、四格表资料/检验的专用公式 

在对两样本率比较时，当总例数於40且所有格子的7>5时,可用/检验的通用公式 (9-1 )。 
实际应用时，为省去计算理论频数的步骤，简化计算公式，常用四格表资料/检验的专用公式 
(9-3) 计算检验统计量/值，即 


V 2 = _ (ad-bc) 2 n (9-3) 

(a + bXc + dXa+c)(b+d) 

式中， cr、 乂 为四格表的实际 频数; ㈠+认心+办㈠+么以+心分别是周边合计数：”为总 

例数，即 w = a + 6 + c+d。 公式 (9-3 冲相应符号见表9-1。 

仍以例 9-1 资料为例，用公式 (9-3) 计算/值,有 


2 _ (20x5-24x21)2x70 
44x26x41x29 ~ 

结果与通用公式 (9-1) 计算的结果相同。 


= 8.40 


三.四格表资料; f 2 检验的校正公式 


/分布界值表的依据是 y 分布，其分布是连续型分布,而计数资料中的实际频数 j 为分类 
资料，是不连续的。因此,用公式 (9-1) 计算的/值查界值表所得的概率 P 偏小，特别是对自由 
度 v=l 的四格表资料的影响更大。为此，美国统计学家 F.Yate〆 1934年)提出了计算/的连续 
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性校正法 (correction for continuity), 其校正公式为 

x l 0.5) 2 (9-4) 

2 (\ad-bc\-n/2) 2 n ( 95 ) 

Ac Ca+bXc + d)(a+cXb+cO 

上述公式分别是对通用公式 (9-1) 和专用公式 (9-3) 的校正。在实际工作中，对于四格表资料， 
通常规 定为： 

(1) 当於40且所有的7>5时,用/检验的基本公式 (9-1) 或四格表资料/检验的专用公式 
(9-3) 0 

(2) 当於40但有 1<T<5 时，用四格表资料/检验的校正公式。 

(3) 当 W <40, 或 r< 1时，用四格表资料的 Fishei •确切概率法 (Fisher's exact test)。 

例 9-2 某医师欲比较胞磷胆碱与神经节昔脂治疗脑血管疾病的疗效，将58例脑血管疾病 
患者随机分为两组，结果见表9-2。问两种药物治疗脑血管疾病的有效率是否不同？ 

表 9-2 两种药物治疗脑血管疾病有效率的比较_ 


药物分组 

有效 

无效 

合计 

有效率（％ } 

胞磷胆碱组 

25(23.7) 

3(4.3) 

28 

89.29 

神经节苷脂组 

24(25.3) 

6(4.7) 

30 

80.00 


49 

9 

58 

84.48 


注： 括号内数字为理论频数 

( 1 ) 建立检验假设并确定检验水准 

H 0： ^,=^ 2 ,即两种药物治疗脑血管疾病的有效率相等 

Hi: 冗和 ，即两种药物治疗脑血管疾病的有效率不等 

a=0.05 

⑵计算检验统计量 

按照公式 (9-2) 计算各观察值的理论频数,记于表 9-2 的括号中。本例《=58,但有2个格子 
的理论频数分别 4.3 和 4.7, 均为 1<T<5, 需用四格表资料/检验的校正公式(9~4)或公式 (9-5 )。 

用公式 ( 9-5 )计算校正/值 

2 (125 x 6-3 x 24|-58/2) 2 x 58_ q37/: 

Xc — 49x9x28x30 ' 

v=(2-l)(2-l)=l 

(3) 确定/>值，作岀推断结论 

以 v=l 查附表7的/界值表得尸>0.05。按《=0.05水准，不拒绝％，尚不能认为两种药物 
治疗脑血管疾病的有效率不等。 

四、四格表资料的 Fisher 确切概率法 

当四格表资料中出现《<40或 r<l， 需改用四格表资料的 Hsher 确切概率法。该法是一种 
直接计算概率的假设检验方法，其理论依据是超几何分布 (hypergeometric distribution ) 0 四格表 
的确切概率法不属于/检验的范畴，但常作为四格表资料假设检验的补充。 

确切概率计算法的基本思 想是： 在四格表周边合计数固定不变的条件下，利用公式 (9-6) 直 
接计算表内四个格子数据的各种组合的概 率巧， 然后计算单侧或双侧累计概率戶，并与检验水 
准 a 比较,作出是否拒绝丑。的结论。 
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(.a+byXc+d)Ka+c)\Qj+d)\ 



式中 A C , A w 等符号的意义同表 9-1 t ^P s = hr 为阶乘符号,0! = 1。 

下面用实例说明其检验原理和检验 方法。 

例 9-3 某研究者为研究乙肝蛋白预防白兔胎儿宫内感染 HBV 的效果，将17例 HBsAg 
阳性白兔随机分为预防注射组和非预防组，观察两组所产出的新生白兔 HBV 感染情况,结果见 
表9-3。问两组新生白兔的 HBV 总体感染率有无差别？ 


表 9-3 两组新生白兔 HBV 感染率的比较 


组别 

阳性 阴性 例数 

感染率(％) 

非预防注射组 
顶防组 

7 2 9 

2 6 8 

25.00 

合计 

8 9 17 

47.06 

本例《= 17<40,不满足/检验的应用条件，宜用 Fisher 确切概率法。其假设检验步骤 如下： 

( 1 ) 建立检验假设并确定检验水准 

Ho： 7C^7C 2 , 即两组新生白兔 HBV 的总体感染率相等 

H'in 私， 即两组新生白兔 HBV 的总体感染率不等 
a = 0.05 

(2) 计算概率 

在四格表周边合计数不变的条件下，表 9-3 内4个实际频数变动的组合数共有“周边合计中 
最小数+ 1”个即8 +1 =9个，根据公式 (9-6) 计算各种组合的四格表概率，结果见表9-4。例如 
实际观察到的四格表资料的概率为 

. 9'8'8191 

P =0.041464 

7!2!2!6!17! 


表9>4各种组合的四格表计算的概率 


四格表序号 

阳性 阴性 a-T a 

P 

1 

1 8 -3.76 

0.000370 

2 

2 7 -2.76 

0.011847 

3 

3 6 -1.76 

0.096750 

4 

4 5 -0.76 

0.290251 

5 

5 4 0.24 

0.362814 

6 

6 3 1.24 

0.193501 

r 

7 2 2.24. 

0.041464* 

8 

8 1 3.24 

0.002962 

9 

9 0 4.24 

0 8 

0.000041 


* 为实际数据的四格表 
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(3) 确定累计概率 P 值，作出推断结论 

双侧 检验： 在四格表周边合计数不变的条件下，《值的理论频数为= r fl =( 9 X 9 )/17 = 4.76 ; 
在实际观察频数 a = 7 时， Ifl- 7；H7-4.761= 2.24。观察上述9个2 x 2表，值越大， c 值越小， 
a-T a 值 越大； a 值越小 ， c 值越大 ， a- 7；值越小。若拒绝丑0,尸值的计算应包括7；>2.24的 
四格表的概率之和。双侧累计概率尸值为 

P=P(1 )+P(2)+P(7)+/ , (8 )+/>(9) 

= 0.000370 + 0.01 1847 + 0.041 464 + 0.002 962 + 0.000041 
=0.0567 

根据所得 P 值，在 a = 0.05 检验水准下，不拒绝//。，尚不能认为预防注射组与非预防组的新 
生白兔 HBV 的总体感染率不等。 

单侧 检验： 若本例有充足的医学知识认为预防注射组的感染率不可能高于非预防组，则可 
以作单侧检验，计算包括7；>2.24的四格表的概率之和，即 

尸=尸( 7 )+P( 8 )+ 尸 ( 9 )= 0.041 464 + 0.002 962 + 0.000041 = 0.044 
根据所得尸值，在 a=0.05 检验水准下，拒绝风，接 受历。 可以认为两种疗法不同，预防注 
射组的感染率低于非预防组的感染率。 

同一资料，由于选择假设检验的单侧、双侧不同，得出了不同的结论。如前所述，在资料分 
析时，用单侧检验还是用双侧检验，应根据研究目的在实验设计阶段确定。 

第二节配对四格表资料的/检验 

例 9-4 现有198份痰标本，每份标本分别用 A、B 两种培养基培养结核菌，结果见表9-5。 
问 A、B 两种培养基的阳性培养率是否不等？ 

__表 9-5 两 种培养基培养结核菌结果 _ 

A 培养基 ---- B 培养基 - - 合计 


+ 48(a) 24(A) 72 

20(c) _ 106( <0 __ 

__ 68 130 198 ~ 

本例为配对设计的计数资料。配对设计常用于两种检测方法、两种诊断方法或两种细菌培 
养方法的比较，其特点是对样本中各观察单位分别用两种方法检测或处理，然后按两分类变量 
计数结果。观察结果有四种情况，可整理成表 9-5 的形式。其中，为两法观察结果一致的两 
种情况， 6、c 为两法观察结果不—致的两种情况。当两种处理方法无差别时，对总体有 B = C t 
即两总体率相等由于是样本数据，抽样误差不可避免，样本中的办和 c 往往不等 
等价于两样本率不等)。为此，可以使用 McNemar 假设检验方法，其检验统计量为： 

2 = (^£)1 =1 (9-7) 

X b+c 

^J\b-c\-\y_ v=l (9-8) 

式 (9-7) 用于 (6+c)>40, 式 (9-8) 用于 (6+c)<40 的情况。值得注意的是，该法一般用于样 
本含量不是很大的资料。因本法仅考虑两法结果不一致的情况(匕 c)， 而未考虑样本含量《和 
两法结果一致的两种情况 ( fl ， ^)，当„很大且与 J 的数值很大时 （ 即两法的一致率较高），即使 
检验结果有统计学意义，其实际意义可能并不大。 
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本例的检验步骤 如下： 

( 1 ) 建立检验假设并确定检验水准 

Ho： 5 = C， 即两种培养基的阳性培养率相等 
H r .B 丰 C , 即两种培养基的阳性培养率不相等 
a = 0.05 

(2) 计算检验统计量 

本例6 + c > 40 ， 用式 (9-7) 计算得 


(3) 确定/>值，作出推断结论 

査/界值表 （ 附表 7) 得尸>0.05,按 d=0.05 水准，不拒绝//。，尚不能认为两种培养基的阳 
性培养率不同。 

需要 注意： 配对设计的四格表资料只能用配对/检验，而不能随意转化为两组独立样本的 


第三节 Rxc 列联表资料的/检验 

前面介绍了两个样本率比较的/检验方法。本节介绍具有及行和 c 列的列联表(称为及 x c 
表)资料的/检验，用于多个样本率或多个构成比的比较。表资料的/检验仍可以使用公 
式 (9-1 )0 

一、及 xC 表; f 2 检验的专用公式 

若使用公式(9-1)，需先计算理论频数 a (/= i ，2, …， /e，y=i，2r..，c)， 比较烦琐，为此可 
将其化简后得 x c 列联表资料/检验的专用公式，即 



式中，《为总例数，冯为列联表中第/行和第 y 列格子中的实际频数，》，和分别为相应行和列 
的周边合计数。在无效假设风下，/统计量服从自由度为 v 的;分布。 

例 9-5 某医院用三种方案治疗急性无黄疸型病毒肝炎254例，观察结果见表 9-6, 问三种 
方案治疗急性肝炎的有效率是否不同？ 

表 9-6 3种方案治疗急性肝炎的效果 

组别 例数 有效 无效 有效率(％)^~ " 

西药组 100 51 49 51.00 

中药组 80 35 45 43.75 

中西药结合组 74_59_15_ 79J3 _ 

合计 _254_145_109_ 57.09 

本例为三个样本率的比较，是3 x 2表资料。 

( 1 ) 建立检验假设并确定检验水准 
//o： 5种治疗方案的有效率相等 
//,：二种治疗方案的有效率不全相等 




(2) 计算检验统计量 
按式 (9-9) 计算/值 

2 … f 51 2 49 2 . 35 2 . 45 2 . 59 2 . 15 2 

^100 x 145 100 x 109 80 x 145 80 x 109 74 x 145 74 x 109 ) 

= 254 x (0. 1794 + 0.2203 + 0. 1056 + 0.2322 + 0.3244 +0.0279 -1) 

= 22.81 

v=(3-1)x(2-1)=2 

(3) 确定/>值，作出推断结论 

査/界值表得尸<0.05,在«=0.05的检验水准下，拒绝风， 接受 可以认为三种疗法的 
有效率有差别。 

例 9-6 某研究人员收集了亚洲、欧洲和北美洲人的 A 、 B 、 AB 、0 血型资料，结果见表9-7, 
问不同地区人群的血型分布(构成比)是否不同？ 

表 9-7 世界三个不同地区 血型样本的频数分布 _ 

: 鱗 例数 A _ B _ AB _ O 

亚洲 1080 321 369 95 295 

欧洲 517 258 43 22 194 

北美洲 995_408_106_37_444 

•nif _2592_987_518_154_933 


本例为三个样本构成比的比较，是3 x 4表资料。 

( 1 ) 建立检验假设并确定检验水准 

H q : 不同地区人群血型分布总体构成比相同 
环：不 同地区人群血型分布总体构成比不全相同 
a =0.05 

(2) 计算检验统计量 
按式 (9-9) 计算/值为 


/ = 2592 x 


[ 3212 _ + 36 j ! —十…十」^ —-1] =297.38 

1^987 x 1080 518 x 1080 933 x 995 ) 


v =(3- l ) x (4- l )=6 

(3) 确定/>值，作出推断结论 

査附表7得/ 005 . 6 = 12.59, /> 12.59, P <0.05, 在 a = 0.05 检验水准下，拒绝//。，可以认为三 
个不同地区的人群血型分布不同。 

二、多个样本率间多重比较 

当多个样本率比较的推断结论拒绝//。、接受祝时，只说明各总体率之间有差别，但不能说 
明任两个总体率之间有差别。多个样本率间的两两比较若直接用四格表资料的/检验进行多 
重比较，将会增加犯 I 类错误的概率。为此，需要采用多个样本率的多重比较方法。 

多个样本率间的多重比较有/分割法、 Sche ffg 可信区间法和 Bonferroni 方法，应用这些方 
法能够保证假设检验中I类错误 a 的概率不变。这里仅介绍最简单的 Bonferroni 方法，其基本 
思想是根据重复检验的次数重新规定检验水准这是一种比较保守的方法，比较的组数不宜 
过多，实际中通常有两种情况。 

1. 多个实验组间的两两比较分析目的为 A 个实验组间，任两个率均进行比较，检验水准 




乂 可用式 (9-10) 估计： 
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式中为需要比较样本率的组数。 

2. 实验组与同一个对照组的比较分析目的为各实验组与同一个对照组比较，而各实验 j 
组间不需要比较。检验水准 V 可用式 (9-11) 估计： 

a ,= i^T (9-11) 

式中 / b 为样本率的个数，即需要比较样本率的组数。 

例 9-7 对例 9-5 中表 9-6 的资料进行两两比较，以推断是否任两种疗法治疗急性无黄疸型 
病毒肝炎的有效率均有差别？ 

本研究目的为三个实验组间的两两比较，检验水准 V 用式 (9-10) 估计得 

a，= ―—— =^=0.0166 
3 x (3- l )/2 3 

( 1 ) 建立检验假设并确定检验水准 

Ho： 7 T A = ^ B , 即任两对比组的总体有效率相等 
如 ， 即任两对比组的总体有效率不等 
a = 0.05 

(2) 计算检验统计量 

本研究目的为三个实验组间的两两比较,两两比较的 2 x 2 表及用公式 (9-3) 分别计算任两 
对比组的检验统计量/值结果见表9-8。 

(3) 确定 P 值，作出推断结论 

查附表7,按 W = 0.0166 检验水准，得到自由度 v = l 的/界值在 5.02-6.63 之间，经插值法! 
得到/。(》66,1 = 5.97,任意两组比较的尸值结果见表9-8。西药组与中药组相比，接受汉)，两组之 
间无显著性差异(/ >>0.0166); 中西医结合组与单纯使用中药组或西药组相比，拒绝"。，两组疗 
效的差异具有统计学意义(/><0.0166)，说明中西医结合治疗急性无黄疸型病毒肝炎具有更好的 
疗效。 

_ 表 9-8 三种疗法治疗肝炎有效率的两两比较 _ j 

对比组 有效 醜 .j v p 1 

西药组 51 49 100 0.94 <5.97 >0.0166 

中药组 35_45_80 

合计 _86_94_180___ 

中药组 35 45 80 20.93 >5.97 <0.0166 

中西药结合组 59_15_74 

合计 _94_60_154___ 

西药组 51 49 100 15.10>597 <0.0166""" 

中西药结合组 59_15_74 

合计 _110_64_174___ 

例 9-8 以例 9-5 中表 9-6 资料中的西药治疗组为对照组，中药治疗组与中西药结合为试验 | 
组，试分析两试验组与对照组的总体有效率有无差别？ 
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本研究目的为各试验组与同一对照组的比较，检验 水准乂 用公式 (9-1 1 )估计得 


« ,= ，。:、 = 0.0250 

( 1 ) 建立检验假设并确定检验水准 

H 0 ： 7U T =7C C ， 即各试验组与对照组的总体有效率相等 

H r .7U T i：7C Ci 即各试验组与对照组的总体有效率不等 

a = 0.05 

⑵计算检验统计量 

本例为各试验组与同一对照组的比较，计算/统计量的结果见表9-8。 

(3) 确定尸值，作出推断结论 

査附表7 = 5.02, 按 Y = 0.0250 水准，中药组与西药组相比较，接受//,,，两组疗效 
无显著差异 (P>0.025); 中西药结合组与西药相比，拒绝//。，两组疗效的差异具有统计学意义 
(P<0.025), 说明中西药结合治疗急性无黄疸型病毒肝炎的疗法优于单纯用西药的疗法。 

三、 /?><(： 表 Z 2 检验的注意事项 

1. 一般认为,心 C 表中各格子的理论频数不应小于1，并且 1<T<5 的格子数不宜超过格子 
总数的1/5。若出现这种情况，可通过以下方法 解决： ①增加样本含量，使理论频数 增大； ②根据 
专业知识，考虑删去或合并理论频数太小的行 或列； ③改用 x C 表的 Fisher 确切概率法。 

2. 多个样本率比较,若统计推断结果拒绝//。， 接受汉 时，只说明各总体率之间总的来说有 
差别，但并不能说明任两个总体率之间均有差别。要进一步推断，需做多个样本率的多重比较。 

3. 及 x C 表的/检验与分类结果的排序无关。对于有序 RxC 表 ，如果分析的目的不是对 
构成比进行比较，例如比较两组的疗效，试验结果为“痊愈、显效、有效、无效”，则不宜使用/ 
检验，对此可以选用后面第十章的非参数秩和检验方法。 


练习题 

一、单项选择题 

1. 两样本率比较，差别具有统计学意义时>值越小说明 （） 

A. 两样本率差别越大 B. 两总体率差别越大 

C. 越有理由认为两样本率不同 D. 越有理由认为两总体率不同 

E. 越有理由认为两样本率相同 

2. 欲比较两组阳性反应率，在样本量非常小的情况下（如《, < 10, « 2 < 10)，应采用的假设 
检验方法是 （） 

A. 四格表/检验 B. 校正四格表;^检验 

C. Fishei •确切概率法 D. 配对/检验 

E. 校正配对/检验 

3. 进行四组样本率比较的/检验，如/ >/ n 礼 3 ,可认为 （） 

A. 四组样本率均不相同 B. 四组总体率均不相同 

C. 四组样本率相差较大 D. 至少有两组样本率不相同 

E. 至少有两组总体率不相同 

4-从甲、乙两文中，查到同类研究的两个率比较的/检验，甲文/>/_.,，乙文〆 



E. 容许误差和检验水准 

6. 通常分析四格表需用连续性校正/检验方法的情况是 （） 

A. r<5 B. r<l 或 w<40 

C. T < \ JL«<4() D. 1 矣 r<5 且 《>40 

E. T<5 或 w<4() 

7 . 当四格表的周边合计数不变时，如果某格的实际频数有变化，则其理论频数是 （） 

A. 增大 B. 减小 

C. 不变 D. 不确定 

E. 随该格实际频数的增减而增减 

8. 对四种药物进行临床试验，计算显效率，规定检验水准 a = 0.05, 若需要进行多重比较， 
用 Bonferroni 方法校正后的检验水准应该是（ ） 

A. 0.017 B. 0.008 

C . 0,025 D. 0.005 

E. ().013 

9. 对药物的四种剂量进行临床试验，计算有效率，规定检验水准《=0.05,若需要进行多重 
比较，用 Bonferroni 方法校正后的检验水准应该是（ ） 

A. 0.050 B. 0.010 

C. 0.025 D. 0.005 


E. 0.017 

10. 利用/检验公式不适合解决的实际问题是 （) 

A. 比较两种药物的有效率 B. 检验某种疾病与基因多态性的关系 

C. 两组有序试^■结果的药物疗效 D. 药物三种不同剂量显效率有无差别 

E. 两组病情“轻、中、重”的构成比例 
二、计算与分析 

1. 某神经内科医师观察291例脑梗死病人，其中 U)2 例病人用西医疗法，其他1的例 
病人采用西医疗法加中医疗法，观察一年后，单纯用西医疗法组的病人死亡13例，采用中 
西医疗法组的病人死亡 9 例，请分析两组的病死率差异是否有统计学意义？ 

2. 某医院研究中药治疗急性心肌梗死的疗效，临床观察结果见下表:，问接受两种不 




3. 某医师观察三种降血脂药 A，B,C 的临床疗效，观察3个月后，按照患者的血脂下 
降程度分为有效与无效，结果如下表，问三种药物的降血脂效果是否 不同？ 


三种药物降血脂的疗效 


药物 

例数 

有效 


无效 

有效率（％) 

A 

145 

120 


25 

82.76 

B 

87 

60 


27 

68.97 

C 

62 

40 


22 

64.52 

合计 

294 

220 


74 

74.83 

4. 某医师按照白血病患者的发病锖况，将308例患者分为两组，并按 ABO 血型分类 

记数，结果见下表。试问两组患者血型总体构成有无差别？ 




308例急、慢性白血病患者的血型分布 






血型 



数 

A 

B 

O 

AB 

急性组 

189 

60 

47 

61 

21 

慢性组 

119 

42 

30 

34 

13 


308 

102 

77 

95 

34 


5-为研究某补钙制剂的临床效果，观察56例儿童，其中一组给予这种新药，另一组给 
予钙片，观察结果如下表，问两种药物预防儿童的佝偻病患病率是否不同？ 


两组儿童的佝偻病患病情况 


组别 

病例数 

非病例数 

合计 

患病率（％) 

新药组 

8 

32 

40 

20.0 

钙片组 

6 

10 

16 

37.5 

合计 

14 

42 

56 

25.0 

6- 某医院147例大肠杆菌标本分别在人， B 两种培养基上培养，然后进行检验，资料 

见下表，试分析两种培养基的检验结果是否有显著性差别？ 



A、B 两种培养基上培养大肠杆菌标本结果 


A 培养基 


B 培养基 


合计 

+ 


- 

+ 

59 


36 

95 

- 

15 


37 

52 

合计 

74 


73 

147 






第十章非参数秩和检验 


前面介绍的检验方法，如样本均数的/检验、方差分析，样本率比较的/检验,都是在总体 
分布已知的前提下对参数进行的检验，即参数检验方法 (parametric test)。 然而，在实际中有些 
资料总体分布类型未知，或者不符合参数检验的适用条件，这时可以使用不以特定的总体分布 
为前提，也不针对总体参数做统计推断的方法，即非参数检验方法 (mmparametric test)。 

非参数检验的方法有很多，本章仅介绍通过样本数据排序编秩后，基于秩次比较的非参数 
检验。这种方法通常适 用于： ①总体分布类型未知或非正态分布 数据； ②有序或半定量 资料； 
③数据两端无确定的数值。非参数检验方法的优点是适用范围广,但由于这种方法只是利用了 
数据的秩次信息，因此当数据满足参数检验的条件时，应首选参数检验，否则检验效能 降低； 当 
数据不满足参数检验的条件时，才应选择非参数检验方法。 

第一节 配对设计资料的符号秩和检验 

Wilcoxon 符号秩检验 (Wilcoxon signed-rank test), 由 Wilcoxon 在1945年提出，属于配对设计 
的非参数检验，用于推断配对资料的差值是否来自中位数为零的总体。其基本 思想： 假定两种 
处理效应相同，则差值的总体分布对称，总体中位数为0,也就是说样本的正负秩和绝对值应相 
近； 反之，若两种处理效应不同，则差值总体中位数不为0,中位数偏离0越明显，样本的正负秩 
和绝对值就会相差越大，原假设风成立的可能性越小。下面结合实例说明其检验 方法。 

例 10-1 临床研究白癜风病人的 IL-6 指标在白斑部位与正常部位有无差异，检测结果如 
表 10-1 所示。 


表 10-1 白癜风病人的不同部位白介素指标 (pg/ml) 


病人号 

(1) 

白斑部位 
(2) 

正常部位 
(3) 

d=( 3)-(2) 

(4) 

秩次 

(5) 

1 

40.03 

88.57 

48.54 

6 

2 

97.13 

88.00 

-9.13 

-2 

3 

80.32 

123.72 

43.40 

4 

4 

25.32 

39.03 

13.71 

3 

5 

19.61 

24.37 

4.76 

1 

6 

14.50 

92.75 

78.25 

8 

7 

49.63 

121.57 

71.94 

7 

8 

44.56 

89.76 

45.20 

5 

合计 一 




7V = 34,r. = 2 


( 1 ) 建立检验假设,确定检验水准 

Ho： M,=0, 即两个不同部位 IL-67jC 平差值的总体中位数为零 
: M^0, 即两个不同部位 IL-6 水平差值的总体中位数不为零 
a = 0.05 

(2) 编秩次并求秩和统计量 

首先求出各对数据的差值，见表 10-1 的第 (4) 列； 然后编秩次,按照差值绝对值由小到大编 
秩，并按差值的正负给秩次加上正 负号； 若差值为 “0”，舍去不计，总的对子数也要减去此对子 
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数(记为 《); 若差值的绝对值相等,取其平均秩次。最后，分别求正负秩次之和 r + 与 r_( 参见表 
10-D, 任取 r + 或71为检验统计量 r, 本例选取 r=2 0 
(3) 确定 P 值，做岀推断 

当衫50时，根据《和 r 可查配对设计用的 r 界值表(附表8)，若检验统计量 r 值在上下界 
值范围内，则 p 值大于表上方对应的概 率值； 若 r 值在上下界值外，则 p 值小于表上方对应的 
概率值。本例《 = 8,査 T 界值表 r 0 .05(8)=3~33, T=2 不在3~33范围内，尸 <0.05, 按 a = 0.05 水准 
拒绝风，即白斑部位与正常部位的白介素水平有显著差异。 

需要注 意：当 《>50时，无法査表,可利用秩和分布的近似正态法进行检验。已知在原假设 
汉)成立时，近似地有 

>0i + l)(2/i+l)/24 

其中 0.5 为连续性校正数， z 近似服从标准正态分布。 

当相同秩次较多时, z 值偏小,应采用校正公式，即 



其中 （ 为第 j 个相同秩次 ( 即平均秩次)的个数，假定有2个秩次为 2.5 ，4个秩次为 8.5 ，则/, = 2, 
4=4,故有 

K _ = W 一 / I )+(f 2 3 -/ 2 ) = (2 3 - 2)+(4 3 - 4) = 66 

例 10-2 指导28名有轻度牙周疾病的成年人进行良好的口腔卫生保健，6个月后，按照牙 
周情况好转高低程度分别给予+ 3、+ 2、+1;牙周情况变差程度依次给予分数 -1 ，_2， - 3;没有 
变化给予0 分。 数据如表 10-2 所示，试对此项干预的结果进行 评价。 


表 10-2 实行良好口腔卫生习惯6个月后牙周情况的变化程度 



( 1 ) 建立检验假设，确定检验水准 
Ho： M d =0 , 即前后变化分数的总体中位数为零 
即前后变化分数的总体中位数不为零 

a = 0.05 

⑵计算 r 统计量 

记变化分数的绝度值为 A 编秩及计算正负秩和结果如表 10-3 所示。 

表 10-3 实行良好口腔卫生习惯6个月后牙周情况的变化程度 
频数 ' ~ 

d ~~ 1 + 总和 秩次范围平均秩次 负秩和 正秩和 

fiL’ (7M2M6) (8)=(3)X(6) 

4 6 10 bAO 5^5 22 33 

2 2 5 7 11-17 14 28 70 

3 2 4 6 18-23 20.5 41 82 
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(3) 确定/>值，做出推断 

查尸界值表（附表8)， 7^(23)=73-203, r=r.=91>73, : T 统计量值落在上下界值之间，尸>0.05, 
按 a = 0.05 水准，不拒绝//。，即对有轻度牙周疾病的成年人,实行良好的口腔卫生6个月后，尚 
不能说明此项干预对牙周改善有显著效果。 

本例若用近似正态法计算，由于上述资料相同秩次较多，用校正公式 ( 1仏2)得出 
z _ |r-/i(w +1)/4|-0.5 

ln(n + lX2n + l ) ~ 

V 24 

_ [91-23 (23 + l)/4|-0.0S 

f23x(23 + l)x(2x23 + l) (10 3 -10) + (7 3 -7) + (6 3 -6) 

V 24 48 

= 1.44 

査 z 界值表 z 0 .05/2= 1.96, 本例中&< 1.96,/»>0.05,按 a = 0.05 的检验水准，不拒绝//«>，结论 
同前。 

第二节两独立样本比较的秩和检验 

对于计量资料，如果两个样本分别来自方差相等的正态分布总体的假设成立，则可以使用 
，检验比较两样本均数的差别是否具有统计学 意义； 否则采用非参数秩和检验更为合适。本节 
介绍 Wilcoxon 秩和检验( Wilcoxon rank sum test), 其目的是比较两样本分别代表的总体分布位置 
有无差异。 

一、查表法 

例 10-3 观察有无淋巴细胞转移的胃癌患者的生存时间(见表 10-4), 问两组患者的生存时 
间是否不同？ 

表10~4两组胃癌患者的生存时间（月） 

无淋巴细胞转移 有淋巴细胞转移 ~ 


时间 

秩次 

时间 

秩次 

12 

4.5 

5 

1 

25 

10 

8 

2 

27 

11 

12 

4.5 

29 

12.5 

12 

4.5 

38 

17 

12 

4.5 

42 

19 

17 

7 

46 

20 

21 

8 

46 

21 

24 

9 

56 

23 

29 

12.5 

60 

24 

30 

14 



34 

15 



36 

16 



40 

18 



48 

22 

»1 = 10 

7^ = 162 

|? 2 = 14 

T 2 =138 


笔记 
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( 1 ) 建立检验假设，确定检验水准 

Ho ： 有无淋巴细胞转移患者生存时间的总体分布位置相同 

Hr . 有无淋巴细胞转移患者生存时间的总体分布位置不同 

a=0.05 

(2) 确定秩和检验统计量 r 

首先编秩号，即将两样本24个数据由小到大统一编秩，结果见表10-4。排序时若有相同数 
:据，取平均秩次。本例中两组有相同的观察值12与29,原秩次分别应为3、4、5、6与12、13,所 
| 以取平均秩次分别为 4.5 和12.5。进而，将两组数据的秩次分别求和，若两组例数相同，则任取 
I 一组的秩和作为统 计量； 若两组例数不同，则以例数较小者对应的秩和作为统计量。本例中两 
组例数分别10、14,取较小者为/»,=10， r= r, =162。 

(3) 确定 P 值，作出推断结论 

当»^10,叫 -«fio 时，查两样本比较的 r 界值表 （ 附表 9), 先从表的左侧査 A (两样本量 
I 较小者)，本例为10;再从表上方找到两样本量的差(《 2 -，本例两者交叉处即为 r 
!的临界值。将检验统计量 r 值与 r 的临界值作比较，如果 r 在界值范围内，则尸值大于表上方 
| 的概 率值; 若 r 等于界值或在界值范围外，则/>值等于或小于表上方的概率值。本例 r 的双侧 
!临界值范围为91〜159,检验统计量7•值为162,超出范围， /^O.OS, 拒绝//。，说明有无淋巴细胞 
!转移的胃癌患者总体平均生存时间不同，无转移组生存时间相对更长。 


二、正态近似法 

假定如果和 r^-n, 超出: T 界值表的范围，可按正态近似检验，检验公式为 
r +l)/2l-0.5 


iT-n.CN+l), 

y[n^CN+ 


,» 2 (^+ 1)/12 
其中 JV= n| +« 2 , 统计量 z 近似服从标准正态分布。 

当相同秩次较多时(尤其等级资料),采用下面校正公式 
|r-«,W+l)/2|-0.5 




其中6为相同秩次的个数，计算方法如前。 

上述公式的基本思 想是： 如果好。成立，由于抽样误差的存在，统计量 r 与总体的平均秩和 
«.(^+1)/2应该相差 不大； 当: r 与 n,(N+1)/2 相差太大时，超过了抽样误差可以解释的范围， 
则有理由怀疑枚的正确性，从而拒绝风。 

例1 (M 44名健康人与24名慢性气管炎病人痰液嗜酸性粒细胞数的测量结果如表 10-5 所 
示，问健康人与慢性气管炎病人痰液中嗜酸性粒细胞数有无差别？ 


嗜酸性粒细胞数 
(1) 




表 10-5 两组人痰嗜酸性粒细胞的秩和计算 

统一编秩 ~~ 

葡乂 Sa 秩次范 i 

(2) _ (3) _ (4) _ (5) 

5 11 1~16 8.5 

18 10 17-44 30.5 

16 3 45-63 54 

_5_0_ 64-68 _66 


例数较小组的秩和 



93.5 

305.0 

162.0 

0.0 

= 560.5 



(1) 建立检验假设，确定检验水准 

风：健康人慢性气管炎病人痰液嗜酸性粒细胞数的测量结果总体分布位置相同 
H t ： 健康人慢性气管炎病人痰液嗜酸性粒细胞数的测量结果总体分布位置不同 
a = 0.05 

(2) 计算检验统计量 

表 10-5 中第 (4) 列按第 (2) 与 (3) 列数据统一编秩号，第 (5) 列为各等级的平均秩次，第 (6) 
列则是较小样本的秩和，本例中 r= T,=560.5, 将其带入公式 (1(M) 得出， 

|r,-”,(AT+l)/2 卜 0.5 

|560.5-24x(68 + l)/2l-0.5 

^1^3-[6 8 5 -68-(16>-16 + 28^28 + 19>-19 + ^-5)] 

= 3.62 

由于 z c =3.62> Zm5/2 = 1.96,尸 <0.05,则按照 a =0.05 检验水准拒绝执,认为健康人与慢性气 
管炎病人痰液嗜酸性粒细胞数的测量结果总体分布位置不同。 

第三节多个独立样本比较的秩和检验 


多组计量资料比较时，若数据不满足方差分析的条件时，可以使用本节介绍的 Kruskal-Wallis 
检验 ( Kruskal-WaUis test ), 又称为 K - W 检验或好检验，这种方法主要用于推断多个计量资料或 
多组有序资料的总体分布位置有无差别。 

例1 0-5 为研究霍乱菌苗不同途径的免疫效果,对不同途径免疫21天后血清抗体滴度水 
平进行了测定，问各组间的血清抗体滴度水平之间是否存在差异？ 


抗体滴度 
(1) 
1:10 
1:20 
1 ：40 
1:80 
1:160 
1:320 
甜 


表 10-6 不同途径免疫21天后血清抗体滴度的分布与秩和计算 


气雾组（亿 /ml) 

80 100 皮下注射组合计 

(2) (3) (4) (5) 

2 4 2 8 

15 7 1 31 

10 12 13 66 

5 7 9 87 

1 2 5 95 

— —_1_96 

33 32_31_— 


平均秩次 80 

(6) (7) 

4.5 9 

20 300 

49 490 

77 385 

91.5 91.5 

_96_— 

_ 1275.5 


秩和 

100 

(8) 

18 

140 

588 

539 

183 




皮下 

(9) 


20 

637 

693 

457.5 

96 

1912.5 


( 1 ) 建立检验假设,确定检验水准 

H 0 ： 三组血清抗体滴度水平的总体分布位置相同 
//,：三组血清抗体滴度水平的总体分布位置不全相同 
a =0.05 

(2) 计算检验统计量// 

首先将各组数据统一按从小到大顺序编秩，如有相等数值则取平均 秩次； 然后分别计算各 
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组的秩和况；最后计算检验统计量丑，即 

斤=丄 玲-侧 (10 - 5) 

其中^^〜+叱+…+叫为各组例数之和。本例 W=96,^ = 1275.5, 及 2 =1468，及 3 =1912.5,由此 
得到 


H 


_ 12 ( 1275.5 2 1468 2 1912.5 2 ) 

= 96x(96+1) X [ 33 + 32 + 31 J 


-3x(96+1)=11.36 


本例相同秩次较多，使用校正公式更加准确，即 


H c = 



(10-6) 


其中 (为第 y 个相同秩次(即平均秩次)的个数。本例有 

H 一 1 1.36 一 12 27 

c ~ 8 3 -8 + 23 3 -23+35 3 -35 + 21 3 -21 + 8 3 -8 ~ • 

96 3 -96 

(3) 确定尸值做出推断结论 

当组数灸=3且每组例数》产5时，可查 H 界值表 ( 附表10 ) 得到 P 值； 当灸>3或灸=3且最小 
样本例数>5时,//近似地服从自由度为 v =k-\ 的/分布，可查/界值表得到尸值。 

本例 k=3 且最小样本例数《,>5,查/界值表， v=k- 1 = 3- 1 =2,/ ⑽⑵ =9.21 ， H c = 12.27 > 
/ ⑽⑵， P<0.01 ，拒绝 // 0 , 三组血清抗体滴度水平的差别具有统计学 意义。 


[ 练习题 

I 一、单项选择题 

I 1. 对医学计量资料成组比较，相对参数检验来说，非参数秩和检验的优点是 （） 

A. 适用范围广 B. 检验效能高 

C. 检验结果更准确 D. 充分利用资料信息 

E. 不易出现假阴性错误 

2. 对于计量资料的比较，在满足参数法条件下用非参方法分析，可能产生的结果是 （） 

A •增加I类错误 B. 增加 n 类错误 

c. 减少I类错误 d . 减少 n 类错误 

E. 两类错误都增加 

3. 两样本比较的秩和检验，如果样本含量一定，两组秩和的差别越大说明 （） 

A. 两总体的差别越大 B. 两总体的差别越小 

C. 两样本的差别可能越大 D. 越有理由说明两总体有差别 

E. 越有理由说明两总体无差别 
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m 


4. 多个计量资料的比较，当分布类型未知时，应选择的统计方法是（ 
A. 方差分析 B. WilcoxonT 检验 


5. 两组数据的秩和检验和/检验相比，其优点是 （） 

A. 计算简便 B. 检验假设合理 

C. 检验效能高 D. 抽样误差更小 

E. 对数据分布不做限制 

6. 两样本比较的秩和检验，其检验统计量『是（ ） 

A. 例数较小的秩和 B. 例数较大的秩和 

| C. 较小的秩和 D. 较大的秩和 

E. 任意一组数据的秩和 

7. 两样本比较的秩和检验，其无效假设是（ ） 

A. 两样本有相同的秩和 B. 两总体有相同的秩和 

C. 两样本分布相同 D. 两总体分布相同 

E. 两总体分布的位置相同 

8. 两样本比较的 Wilcoxon 秩和检验结果显著，判断孰优孰劣的根据是（ ) 

A. 两样本的秩和大小 B. P 值大小 

C. 检验统计量 r 值大小 D. 两样本秩和的差别大小 

E. 两样本平均秩的大小 

9. 在一项临床试验研究中，疗效分为“疾愈、显效、有效、无效”四个等级，现欲比较试验组 
与对照组治疗效果有无差别，宜采用的统计方法是（ ) 

A. Wilcoxon 秩和检验 B. 2 M 列联表/检验 

C. 四格表/检验 D. Fisher 确切概率法 

E. 计算标准化率 

10. 两样本比较的秩和检验中，甲组中最小数据有2个0.2,乙组中最小数据有3个 0.2, 则 
数据 0.2 对应的秩次是 （） 


二、计算与分析 

1 • 某医院测定10名受试者针刺膻中穴前后痛阈的数据，见下表，试分析针刺膻中穴 
前后痛阈值的差异有无统计学意义？ 





2. 8 名健康男子服用肠溶醋酸棉酚片前后的精液中精子浓度检查结果如下表（服用时 
间3个月），问服用肠溶醋酸棉酚片后精液中精子浓度有无下降？ 




8名健康男子服用肠溶醋酸棉酚片前后的精液中精子浓度（万 /ml) 


服药后 

6300 

1200 

1800 

2200 


3. 雌鼠两组分别给以高蛋白和低蛋白的饲料，实验时间自生后28天至84天止，计8 
周:.观察各鼠所增体重，结果如下表，问两种饲料对雌鼠体重增加有无显著影响？ 


高蛋白和低蛋白 亩轴 饲 料雌鼠体童 増 丽量 ( g ] 


高蛋白组 

83~~ 
97 
104 
107 
113 
119 


低蛋白组 
65 
70 
70 
78 
85 
94 


高蛋白组 

123 

124 
129 
134 
146 
161 


低蛋白组 
101 
im 


4. 测得铅作业与非铅作业工人的血铅值 （吨 /lOOg)， 见下表，问铅作业工人的血铅值 
是否高于非铅作业工人？ 


铅作业与非铅作业工人的血铅含量 (pg/IOOg) 


铅作业组 
17 
18- 
20 
25 


非铅作业组 
12 
13 
15 
18 


铅作业组 

43 

44 


_9__34_ | _21^ 


5•用维生素 K, 眼药水对近视眼患者作治疗，对照组用生理盐水作安慰剂，对两组的 
疗效进行观察，结果如下表，试分析维生素 K, 眼药水对近视眼患者的治疗是否有疗效？ 

维生素 K 3 眼药水治疗近视眼患者的疗效观察 




疗效 



刀 

雛 

恢复 

进步 

不变 

变差 . 

维生素 KJM 药水组 

116 

4 

11 

93 

8 

生理盐水组 

91 

I 

10 

60 

20 

合计 

207 

5 

21 

153 

28 


6. 对正常、单纯性肥胖及皮质醇增多症三组人的血浆皮质醇含量进行测定，其结果见 


下表，问三组人的血浆皮质醇含量的差异有无统计学意义？ 






三组人的血浆皮质醇测定值 (nmol/L) 


生肥胖 皮质醇增多症 

•6 9.8 


7. 在针刺麻醉下，对肺癌、肺化脓症及肺结核三组患者进行肺部手术，效果分四级， 
结果见下表，试比较针刺麻醉对三组病人的效果有无差异？ 

三组患者肺部手术的针麻效果 


肺化脓 

肺结核 






第十一章线性回归与相关 


前面的章节中介绍的均为单变量资料的统计分析方法，如描述某一变量的统计特征或是对 
I各组间的差别进行比较。但在实际的医学研究中，常常需要对两个变量之间的关系进行分析， 

I例如年龄与血压、糖尿病患者的血糖与胰岛素水平、孕妇的雌三醇水平与新生儿体重之间的关 
I系等。研究两个变量之间的关系，常用的统计分析方法是线性回归与相关。 


第一节线性回归 

一、 线性回_槪念 

| 假设有两个变量 x 和 y, 当一个变量 at 改变时，另一个变量 r 也相应地改变，此时称义为 

| 自变量 （independent variable), Y 为应变量 （dependent variable ) 0 在医学和生物学现象中，很 
| 多情况7 与尤 在数量上可能存在线性关系，如在研究儿童的年龄与体重的关系时，一般来说 
I儿童的年龄越大其体重亦越重。对此，可以用一个直线方程来描述两个变量间依存变化的数 
,量关系，这样得岀的直线方程叫做线性回归方程 (linearregression equation)。 线性回归方程的 
!形式为 


Y = a + bX (II， 1 ) 

其中，歹是给定 AT 时 F 的估 计值； 为截距 （intercept) 或常数项 （constant term), 6为回归系数 
(regression coefficient), 通过样本数据计算得到。计算 公式： 




式（1 1-2) 和式 （ 1 1-3) 中，心表示; if 与 F 的离均差积和，心表示义的离均差平方和；歹和歹分别 
为两个变量的均值。 

回归系数6和常数项 a 是方程中两个待定的参数，计算这两个参数的数学原理是最小二乘 
法 (method of least squares), 该方法的原则是保证各实测点到回归直线的纵向距离的平方和最小， 
并使计算岀的回归直线最能代表实测数据所反映出的直线趋势，即2 = 1；(^-朽 2 最小。上述 
计算公式就是依据最小二乘法推导出的结果。 

二回归方程的估计 

例1 1-1 研究饮水氟含量与成人骨X线改变指数间的关系，得到了表1 1-1 中所示的资料， 
试进行回归分析。 

( 1 ) 根据表 11-1 的数据绘制散点图（图 1M)。 从绘制的散点图中可以看岀饮水氟含量与成 
人骨X线改变指数之间存在着明显的直线趋势，所以可以进一步考虑建立二者之间的线性回归 
方程。 
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表 11-1 饮水氟含量 (mg/L) 与骨X线改变指数回归分析数据 


调查对象 

饮水氟含置(X) 

骨X线改变指数 （Y) 

XY 

X 2 3 

Y 2 

1 

0.24 


0.40 

0.10 

0.06 

0.16 

2 

0.80 


0.56 

0.45 

0.64 

0.31 

3 

1.DO 


1.91 

1.91 

1.00 

3.65 

4 

1.80 


0.86 

1.55 

3.24 

0.74 

5 

3.12 


5.25 

16.38 

9.73 

27.56 

6 

4.10 


3.40 

13.94 

16.81 

11.56 

7 

5.60 


58.38 

326.93 

31.36 

3408.22 

8 

10.27 


70.33 

722.29 

105.47 

4946.31 

13525.69 

9 

^tf* 

10.81 


116.30 

1257.20 

116.86 

37.74 


257.39 

2340.75 

285.17 

21 924.20 
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图 11-1 

饮水氟含量与成人骨X线改变指数之间关系散点图 



(2) 计算回归系数与常数项 

本例： = 37.74,5^ 2 = 285.17, 1=4.19 
2 y = 257.39, ^y 2 = 21924.20,7=28.60 
X沿 = 2340.75 
代人式 （11-2) 和式 （11-3) 得 

2340 . 75 _ 37,74 x 2 S7.39 

b = -2_ _ _9__ 1261.43 

1 似 ^ iZX)2 285-n-^ 12691 . 

a=Y-bX = 28.60 - 9.940 x 4. 19 = -13.049 

则回归方程为 

7 = -13.049 + 9.94^ 

(3) 作回归直线 

按上述回归方程，在尤实测值的范围内，任取两个相距较远的点4(不， $) 和5(不,之)，连 
接 A、B 两点即得到回归直线。本例可取不= 2,计算出$ = 6.83;不=10.5,计 算出之 = 91.32; 两 
点的连线即为所求回归直线(参见图 ll-l) 0 
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由图可见，饮水氟含量升高，成人的骨X线改变指数也趋向升高，骨X线改变指数 y 随饮 
I 水氟含量尤的变化而变化，散点呈直线趋势，但并不完全在一条直线上，说明除了受自变量的 
影响外，还有其他因素对 f 起作用。 

三、 线性回归的假设检验 

由样本资料计算的回归系数6和其他统计量一样，存在抽样误差，即使总体回归系数#=0, 
由样本资料计算的回归系数6也不可能恰好等于0。因此，需要对线性回归方程进行假设检验。 
(― ) 方差分析 

: K 值的变异可用来反映，而每个 r-7 都可以分解为 


Y-Y = CY-Y')+CY-Y'> 


经推导得 


2(^-30 2 = Z ( ^~^ )2 + Z (r_ ^ )2 (11-4) 

式中，公 1 "-歹) 2 为 r 的离均差平方和，表示应变量 F 的总变异，用岛总 表示； ^CY - 7 )2 称回 
归平方和，表示在 : r 的总变异中，可以用 r 与I的线性关系解释的那部分变异，用怒 M 表示； 
S(r-f) 2 称剩余平方和或残差平方和，用于说明除了 at 对 r 的线性影响之外的其他随机因素 
对: r 的变异的影响，用 ss 赌赫 0 用公式表示有 


(11-5) 


回归方程检验的基本思想 ：如果 x 与 : r 之间无线性回归关系，则怒回归与■^残差都只包含随 
I机因素对7的影响，因此其均方从? 0 ^与差应近似相等，如果两者差别较大，并超出能够 
j 用随机波动解释的程度，则认为回归方程具有统计学意义。对此，可用方差分析方法对其进 
行检验。 

回归系数的假设检验可用下面的简化公式计算，即 


*^610 = bl XY = XX 

55残盖=怒总 -&S 回归 

三个平方和对应的自由度依次为 v 6 =/i-l,v@=l, -2;相应的均方为 


检验统计量为 


下面对例 11-1 数据建立的回归方程进行假设 检验： 
( 1 ) 建立假设检验，确定检验水准 
H 0 ••㈣ 

a =0.05 


JS 酿 




( 11 - 6 ) 

(11-7) 

(11-8) 

(11-9) 

( 11 - 10 ) 




(2) 计算统计量 
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SSf -^ = 21924.2-^1 = 14563.13 

— & 譬腿⑽ 

SS 9&& = SS & - 回归 = 2025.07 


F _ ^ 

~ ^ ' 


ss ^ti /v ®n 12538.06/1 
2025.07/7 


(3 ) 确定/ > 值，得出统计结论 

査 F 界值表 （ 附表 4), v_= 1， v 5E3S =7,F 0 . o ,( 1 .7)= 12.25,F>F 0 . o , c .7), 户 <0.01 ，拒绝 风， 可以 
认为饮水氟含量与成人骨 X 线改变指数之间存在线性回归关系。上面结果可以归纳成表 11-2 
的形式。 


__ ^11-2 方差分析表_ 

变异来源 SS v MS F P 

总变异 14563.13 8 

回归 12 538.06 1 12538.06 43.34 <0.01 

残差 _ 2025.07 _7_ 289.30 __ 


(二） f 检验 

回归系数检验也可以采用/检验的方法，即 

~i^i， v=n — 2 (11-11) 

( 11 - 12 ) 



其中，&为样本回归系数的标准误，反映样本回归系数的抽样 误差; 为剩余标准差，表示应 
变量 : T 值对于回归直线的离散程度。 

例 11-1 数据建立回归方程后，进行/检验，过程 如下： 

( 1 ) 建立假设检验，确定检验水准 

H x ：P^0 
a=0.05 

(2) 计算统计量 

S,, = = 17.01, S t = =1-510 

t = -- ^ 4 5 ~°^ = 6.58, v=9-2=7 

(3) 确定 P 值，作出结论 

根据 v = 7 ，査 / 界值表 ( 附表 2), / 0 .o./2(7)= 3.499, P<0.01, 拒绝//。，结论与 F 检验相同。可以 
看出，统计量 F 与/之间存在确定的数量关系，即# = 本例= 6.58。 




一、 线性相关的概念 


对两变量关系的研究，有时并不要求由尤估计1%而关心的是两个变量之间是否具有直线 
相关关系。例如11名男青年身高与前臂长资料绘制的散点图如图 11-2 所示，为直观地描述两 
个变量之间的关系，可以绘制散点图。由图可以看出，男青年身高与前臂长散点呈直线趋势， 
即男青年身材髙，前臂亦长，说明身高与前臂长之间存在线性相关关系，这种关系称为直线相 
关 (linear correlation ) 或简单相关 (simple correlation )。 



^150 160 170 180 190 

身高(咖） 

图 11-2 11名男青年身高与前臂长散点图 

直线相关用于分析双变量正态分布 (bivariate normal distribution) 资料。直线相关的性质可 
由散点图直观地说明，具体可分为以下几种情况： 

(1) 正相关 (positive correlation): 如图 11-3( 1 ) 所示，各点的分布呈现椭圆形， y 的取值随义 
的取值增加而增加，反之 亦然； 散点的分布越集中，相关越密切，当各点的分布如图 11-3(2) 完 
全在一条直线上时，义与 y 呈完全正相关。 

(2) 负相关 (negative correlation): 如图 11-3(3), 各点的分布也呈现椭圆形，的取值随义的 
取值增加而减少，反之 亦然； 散点的分布越集中，相关越密切，当各点的分布如图 11-3(4) 完全 
在一条直线上时，则 AT 与 r 呈完全负相关。 



(3) 无相关 (zero correlation)： 如图 11-3 中的 (5)、(6)、(7), 无论尤增加还是减少，7不受其影 
响。图 11-3 中的(6)、（7)两种情形，虽然各点分布接近直线，但直线与 尤轴或 7轴平行，使 AT 与 
: T 互不影响，呈无相关。 

(4) 非线性 相关： 如图 11-3 中的(8)，散点分布显示尤与7之间可能存在某种曲线相关，故 
称为非线性相关，这不属于本章介绍的内容。 

在医学研究中，完全正相关或完全负相关的情况几乎不存在。线性相关的正负方向和密切 
程度可以用相关系数进行定量描述。 

.、相关系数及其计算 

相关系数 （correlation coefficient) 又称 Pearson 积差相关系数 (coefficient of product moment 
correlation), 是说明具有直线相关关系的两个数值变量间相关的密切程度和相关方向的统计 
量，其计算公式为 



式中 ，心 表示尤与 y 的离均差积和，心表示尤的离均差平方和，/„表示 r 的离均差平方和。具 
体计算公式为 

E 灯 - di-15) 

/ n ,=X (r -« 2 =E J,2 -^^- (11-17> 

将上述各式的计算数值代人公式 (11-14) 中，即得到相关系数的估计值。 

相关系数 r 没有度量衡单位，其取值范围为 r>0 表示正相关, r<0 表示负相关， 
r = 0表示无相关，即无直线关系，当 W= I时为完全相关。相关系数的绝对值愈接近1,相关愈 
密切； 相关系数愈接近0,相关愈不密切。 

例1 1-2 从男青年总体中随机抽取11名男青年组成样本，分别测量每个男青年的身高和 
前臂长，测量结果如表1 1-3 所示,试计算身高与前臂长之间的相关系数。 
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经 计算： 

^^ = 1891 ， X ^ 2 = 326081 

^r = 500,^y 2 =22810 
[灯 = 86185,«=11 

代入计算公式得 

^ — = 326081- i^- = 1000.909 

lyy = ^ Y2 -^^- = 22810 - 令 = 82.727 

/„ = ^- (S ^ (Zy) = ^185-lg^ = 230.4S5 
按式 (11-14) 计算相关系数为 

230.455 — = 0 8009 
Vl000.909 x 82.727 

由计算结果可见,本例/•为正值,表示前臂长与身高呈正相关关系，而且相关程度较高。 

三、相关系数的假设检-验 

由于/ •是样本统计量，对于男青年的身高与前臂长之间的相关关系，尚需进行假设检验，即 
要判断两个变量义与 y 是否真的存在相关关系，为此需根据 r 值作总体相关系数 P 是否为零的 
假设检验。对此可以用 r 检验法，其公式为 



式中，分母为相关系数；"的标准误。求得/值后查附表2得到尸值，然后根据 P 值的大小决定 
是否拒绝执。为简单起见，也可以直接根据计算出的 r 值，査 r 界值表 （ 附表11 ) 得到戶值，若 
r > ^ 则可以认为两变量之间存在线性相关关系。 

下面对例 11-2 计算得到的 r •值进行假设检验： 

( 1 ) 建立检验假设,确定检验水准 
H o ： p =0, 即身高与前臂长之间不存在线性相关关系 
H '-. P 钟 ，即身高与前臂长之间存在线性相关关系 
«=0.05 
⑵计算统 



(3) 确定 P 值，作出结论 

査 r 界值表(附表 2), 得 r ooow2 . 9 = 3.690, <>4oo M . 9 ,P<0.005, 故按 a = 0.05 检验水准，拒绝 
H 。， 接受 H '， 可以认为男青年身高与前臂长之间存在正相关关系。或直接查产界值表 ( 附表11 ), 
r d .005/2, 9 = 0.776, r > r。. 005/2, 9 , P < 0.005, 结论相同。 



第三节线性回归与相关应用的注意事项 


一.回归分析的应用 

1 . 线性回归方程可应用于以下三个方面 :（ 1 )分析两个变量之间是否存在线性依存 关系； 
(2) 利用回归方程由自变量 x 对应变量 y 进行估计，必要时可以作区间 估计; (3) 利用回归方程 
进行统计控制，即利用回归方程进行逆运算，通过控制自变量 x 取值来限定应变量 r 在一定范 
围内波动。其中应用最多的是第一方面。 

2. 作回归分析时，如果两个有内在联系的变量之间存在因果关系，那么应该以原因变量为 
AT, 以结果变量为 y; 如果变量之间因果关系难以确定，则应以易于测定或变异较小者为 JT。 

3. 在回归分析中，自变量义既可以是随机变量(称为 n 型回归模型，两个变量都服从正态分 
布)，也可以是给定的量(称为I型回归模型，在 a ■取值固定时 y 服从正态分布)。如果 r 不服从 
正态分布，在进行回归分析前，应先进行变量变换,从而使应变量符合回归分析的要求。 

4. 使用回归方程估计 r 值时，尽量不要把估计的范围扩大到建立方程时自变量的取值范围 
之外，由于超出样本取值范围，其线性关系是否成立难以判断,外推要慎重。如例 li-i 中，尤的 
取值范围为 0.24-10.81, 计算估计值时 A •的取值最好在 0.24-10.81 之间。 

二.线性相关分析的应用 

1 . 相关分析理论上适用于两个变量都服从正态分布的情形，如果资料不服从正态分布，应 
先通过变量变换，使之近似正态化后计算其相关系数。如果不能正态化，或针对有序数据则可 
以计算 Spearman Kendall 相关系数进行分析 ( 参考 SPSS 软件说明)。 

2. 相关系数 r 值究竟多大有实际意义，需要根据具体问题而定。一般而言, r«0.3 时，表示 
相关性较差； 0.3 < r S 0.6 时，表明中度 相关; 0.6 < r S 0.8 时,表示有较高度的相关性； r> 0.8 时， 
表明有很高的相关性。 

3. 相关系数可以描述两个变量间相互关系的密切程度和方向。然而，不能因为两变量间 
的相关系数有统计学意义 (Psa), 就认为两者之间存在着因果关系，要证明两事物间确实存在 
因果关系，必须凭借专业知识加以阐明。医学中很多变量的数量变化都可能是由于相关的因子 
调控引起的。 


三.线性回归与相关的区别 

1 . 相关系数的计算只适用于两个数值变量都服从正态分布的情形，而在回归分析中，应变 
量是随机变量，自变量既可以是随机变量 （n 型回归模型)，也可以是给定的量(I型回归模型)。 

2. 线性相关表示两个变量之间的相互关系是双向的，线性回归则反映两个变量之间单向 
的依存关系，更适合分析因果关系的数量变化。 


四、线性回归与相关的联系 


1 . 对同一资料进行相关与回归分析,相关系数 r 与回归方程中的6正负号相同， r 和4为 
正，说明 x 与 r 的数量变化的方向是一致的,; r 增大， r 也 增大; 如果符号为负，说明方向相反。 

2. 对同一样本可以得出I•与6互相转化的公式，两种假设检验完全等价。由于^•的假设检 
验可以直接査表，较为简单,所以也可以用其代替对 A 的假设检验。 

3. 相关与回归可以互相解释。 r 的平方称为决定系数 (coefficientofdeteimination), 可表示为 



R 2 表示回归平方和在总平方和中所占的比重，即 炉 越接近1，回归效果越好。应用决定系数， 
还可以从回归的角度对相关系数做进一步的理解，例如 r=0.5, 有/? 2 = 0.25,说明应变量的变异 
有25%可以由自变量所解释。 


B. 相关系数的绝对值越大 
D. 回归系数的绝对值越大 


B. 回归方程的显著程度越高 
D. 应变量的变异越小 


练习题 

一、单项选择题 

1. 两数值变量的相关关系越强，对应的是 （ 

A. 相关系数越大 
C. 回归系数越大 

E. 相关系数检验统计量的/值越大 

2. 回归分析的决定系数及 2 越接近于1,说明 （ 

A. 相关系数越大 
C. 应变量的变异越大 
E. 自变量对应变量的影响越大 

3. 对两变量X和: T 作简单线性相关分析，要求的条件是（ ） 

A. 尤和 F 服从双变量正态分布 B. 尤服从正态分布 

C. : T 服从正态分布 D. 义和 7有回归关系 

E. 尤和 F 至少有一个服从正态分布 

4. 两组资料作回归分析，直线回归系数6较大的一组，表示 （） 

A. 相关系数 r 也较大 B. 假设检验的尸值较小 

C. 决定系数及 2 较大 D. 决定系数及 2 较小 

e . r 随尤变化其数量有更大的变化 

5. 1〜7岁儿童可以用年龄（岁）估计体重（市斤），回归方程为 f=14 + 4l， 若将体重换成国 
际单位 kg, 则此方程（ ) 

A. 常数项改变 B. 回归系数改变 

C. 常数项和回归系数都改变 D. 常数项和回归系数都不改变 

E. 决定系数改变 

6. 对同一资料进行线性回归与相关分析时，下列正确的情形是 （） 

A. /> = 0时， r=0 B./?>0 时，厶>0 

C. r>0 时，6<0 D. r<0 时，6<0 

E. p<0 时， r>0 

7. 下列双变量中，适用于进行线性相关分析的是 （ > 

A. 年龄与体重 B. 民族与血型 

C. 体重与体表面积 D. 母亲文化水平与子女的智商 

E. 工龄与患病率 

8. 若直线回归系数的假设检验结果/><0.05,则可认为两变量间 （） 

A. 有密切的关系 B. 有一定的因果关系 

C. 相关关系密切 D. 存在数量依存关系 
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E. 有较强的回归关系 

9. 作线性相关分析时，当 《=12，r = 0.767, 查界值表 r (M)( n /2 . w =0.8 23 ，r o . O o 2/2 , lo =0. 7 9 5 , 
r 0 . mf2 , x „ = 0.750 ，则尸值范围为 （） 

A. 0.001 <P<0.002 B. P<0.001 

C. 戶 <0.002 D. 尸 >0.005 

E. 0.002<P<0.005 

10. 通过线性回归分析 (《 = 48), 得决定系数 於=0.49, 则下列说法中错误的 是（ ） 

A. 两个变量具有回归关系 B. 一定有相关系数 r=0.70 

C. 假设检验的自由度 v=46 D. 回归平方和大于剩余平方和 

E. r 的总变异有49°/。可以由义的变化解释 
二、计算与分析题 

1. I 2 名 2() 岁女青年的身高与体重资料如下表，试问女青年身高与体重之间有无相关 
.关系？ 

12名20岁女青年的身高与体重资料 

编号 1 2 3 4 ,5 ', 炎岭7 8 %0 11 12 ] 

身高 （cm) 164 156 172 172 177 180 166 162 172 167 158 152 

体重 （kg) 55 56 60 68 66 65 56 55 60 55 46 51 


2. 某医师研究某种代乳粉价值时，用大白鼠做实验，得到大白鼠进食量和体重增加量 
的资料如下表，试问大白鼠的进食量与体重的增加量之间有无关系？能否用大白鼠的进 
食量来估计其体重的增加量？ 

大白鼠进食量和体重増加量的资料 

动物编号 1 2 3 4 5 6 7 8-~~9 10 11 ~ 

进食: M(g) ~~820 780 720 867 690 787 934 679 639 820 780 

增重量 （g) 165 158 130 180 134 167 186 145 120 150 135 


3. 测得 3 4 47名13岁健康男童的身高和体重，身高均数为 146.4cm， 标准差为 8. 6 lon， 
体重均数为 37.04kg， 标准差为 6.67kg。 身高和体重的相关系数 r=0.74, 试计算由身高推 
体重的回归系数及由体重推身高的回归系数。 

4. 某防治所作病因研究，对一些地区水质的平均碘含量 (吨 /L) 与地方性甲状腺肿患 
病率进行了调查，结果如下表，试问甲状腺肿患病率与水质中碘的含量有无相关关系？ 
_ 局部地区水质的平均碘含量 ( M g/L) 与地 方性甲状腺肿患病率 

地区编号 1 2 3 4 5 6 7 8 9 1Q 11 12 13 14~ 

患病率(％) 40.5 37.7 39.0 20.0 22.5 37.4 31.5 15.6 21.0 6.3 TA 9^0 lo ~ 5A~ 

碘含量 （Hg/L) 1.0 2.0 2.5 3.5 3.5 4.0 4.4 4.5 4.6 7.7 8.0 8.0 8.3 8.5 
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在第十一章中已介绍了用直线回归描述一个应变量与一个自变量之间的线性依存关系，但 
由于事物之间的联系往往是多方面的，特别在医学研究中，某个应变量往往受多个因素（自变 
量）的影响，如儿童身高不仅受年龄影响，而且受性别 影响； 肺活量的大小除与年龄、性别有关 
夕卜，还受身高、体重以及胸围的呼吸差等因素的影响。如果这些因素与应变量之间的关系是线 
性的，则可以应用多元线性回归 (multiple linear regression) 来研究。多元线性回归是研究一个应 
变量与多个自变量之间线性依存关系的统计方法，可以对自变量的作用进行评价，也可以用作 
预测和判别。 


第一节多元线性回归 
一、 多元线性回归方程 

设与应变量 r 有关的自变量有 m 个，记为不 ，石 ，…,足>。假定观 察到” 例样本数据，如表 
12-1 所示。 


例号/ 


表 12-1 多元回归分析数据格式 


_ X 2 _ Xn_ 

•^11 X n … 

x 2X x n … 

Xyi *■■ Xim 

\ \ 9 ^ :. … ； 

_ Xa _ - _ — 


Y , 


y 2 


y 3 




多元线性回归方程可写为 

Y = b 0 + + b 2 X 2 + …+ b m X m (12-1) 

式中， f 为在自变量不，石，…, A 时，应变量 y 的总体平均值的估计值；心，6，匕，…， L 为待定 
系数。其中％相当于一元直线回归方程中的常数项 a， 表示当所有自变量为0时应变量 r 的总 
体平均值的估计值； b/j= 1,2，...， m) 为自变量不的偏回归系数 (partial regression coefficient), 简 
称回归系数，表示除曷以外的其他自变量固定不变的情况下，< 每改变一个测量单位所引起的 
应变量 y 的平均改变量。 

与直线回归相同，多元线性回归模型的参数估计可以用最小二乘法得到，即根据观察到的 
n 例数据，代人公式 （12-1 )，得到残差平方和 

Q = 其 (d) 2 = E - (6 0 + b x X n + b 2 X i2 + . • • + b m X im )] 2 (12-2) 

然后计算出使0最小的6,，，…人。常数项~可用下式求出 

b 0 = Y-^X, + b 2 X 2 +- + bJCj (12-3) 

由于多元线性回归方程的最小二乘法计算量较大，需要借助统计软件完成。本章将主要通 
过实例介绍多元线性回归分析的基本步骤，并利用 SPSS 统计软件完成计算。 
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例 12-1 20名糖尿病人的血糖、胰岛素及生长素的测定值列于下表中，试建立血糖对于胰 

岛素及生长素的二元线回归方程。 

表 12-2 糖尿病人的血糖、胰岛素及生长素的测定值 



根据上述研究问题，采用多元线性回归方法，其回归方程为 、 

Y = b^b x X x + b 2 X 2 

使用表 12-2 数据拟合该方程，由 SPSS 统计软件可得到表 12-3 的主要结果。 

表 12-3 回归系数估计结果 

变量 回归系数 标准误 t P 

常数项 17.011 2.472 6^880 <0.001 

Xi -0.406 0.094 -4.313 <0.001 

_ ^2 _0098_ 0.116 _0843_ 0.411 

由此得到回归方程为 

Y = 17.011- 0.406^, + 0.098^ 2 

' 多元线性回! )1 方程的假设检验 

由样本计算出的回归系数6,是总体回归系数爲的估计值 (7= 丨 ， 2,...，/«)。如果总体回归 
系数等于0,则由于存在抽样误差，仍可使样本估计的系数不等于0。与直线回归的情形相 
M， 耑对所建、’ /. 的多元回! U// 程进行假设检验，以判断它是杏具有统计学意义„多元线性回妇 
方程的假设检验分为模哦检验和单个回归系数检验。 
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(一）模型检验 

可用方差分析方法检验应变量 r 与 m 个自变量之间是否存在线性回归关系。在有多个自 
变量的情况下，应变量总离均差平方和可分解成回归平方和和残差平方和 SS fV ： M 个 
部分，即 


其中，总离均差平方和为 


回归平方和为 


•SS" 总 = 5S 回归 + SS 餘 


怒总 = Z (卜歹 )2 =2> 2 - 



其中^•为回归系数， 心为第 y 个自变量与应变量 y 的离均差积和。残差平方和为 


(12-4) 


(12-5) 


(12-6) 


SS 職= Z< y -^ 2 = H (12-7) 

各离均差平方和所对应的自由度分别为 v & = n - l t v 回归 = m ，v m = n -m-l 0 F 统计量计算公式为 

F - Ts ^：-：- n ^ (_ 

在无效假设凡:成=/? 2 =”.=义= 0成立条件下，统计蜇 F 服从 F —' ，分布，如果 F 》 F al —.'、， 
则在《水平上拒绝风，认为 m 个自 变量不 ，不，…，；与应变量 y 之间存在线性回归关系，即回 
归方程有统计学 意义； 否则，不拒绝 // n , 即回归方程无统计学意义。 

对于例 12-1 ，模型检验的假设为 
^0： A =^2 = 0 

钟 和爲#0至少有一个成立 
a=0.05 

由 SPSS 统计软件可得到表 12-4 的模型检验结果。结果显示， F=21.54, 尸 <0.0001 ，拒绝 
枚，即所求回归方程具有统计学 意义。 


__ 表12~4回归方程的方差分析表 _ 

^ 异来源 SS v MS F P~~ 

回归 116.626 2 58.313 21.539 < 0.0001 

残差 46.025 _17_ 2.707 __ 

总变异 _ 162.651 _19__ 


(二）偏回归系数检验 

回归方程具有统计学意义，只能说明整体的情况，并不能保证每个自变量都具有统计学意 
义。因此，需要对每个自变量的回归系数进行假设检验，具体有 F 检验和/检验两种方法，两种 
检验方法的结果相同。 

1. F 检验 

( 1 ) 建立检验假设，确定检验水准 

Hn：fi,=0 

a=0.05 

(2) 计算 F 统计董 

首先，建立含有/«个自变量的回归方程，并计算回归平方和怒刚4和残差平方和 SS ㈣ 0 然 
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后，将拟检验的自变量=丨 ， 2 ，…， m ) 从中剔除，重新建立含 m - 1个自变量的回归方程，并 
计算不包含馮的回归平方和 SS mM . j ) t W \ 4=怒刚厂怒刚#为 A； •单独引起的回归平方和的改变 
量，称其为偏回 U 平方和（自由度为1)。最后计算 F 统计量，即 

厂=―^— 

， SS^ K /(n-m-\) 

( 3 ) 在// 0 成 >>:时 . 尸服从^ ，分 布：查方差分析 f 界值表，如果7=^ & 

则在《水平上拒绝私，认为自变 M 馬具有统计学意义。 

对于例 12-1 ，胰岛素本和生长素不全部纳人回归方程时，有 
5*5 刚,=1 16.6265 ，55« £ .=46.0249 
把名 从回归方程中取出，建立不与 y 的回归方程为 

y = 7.012 + 0.4294 

此时 


(12-9) 
■，一 ， 即尸彡 a . 


怒刚 (_"= 66.2746 

t/,= SS [am - 5^ 归㈠ )=116.6265 - 66.2746 = 50.3519 
若把不从回归方程中取出，建立不与 y 的回归方程为 

y = 18.7961-0.4585^, 


此时 


由公式 （12-9) 得 


£/ 2 =5^】归一 ■SS raw( _ 2) = 1 16.6265-114.7032= 1.9233 


r-1) 46.0249/(20-2-1) 


F 7 = --=-一一- = 0.7104 

SS ^/ Cn - m - X ) 46.0249/(20 - 2-1) 

查/^界值表 （ 附表 4)，F <umui7> =3.59， < F l >3.59,_P 2 <3.59。 因此，在 a=0.05 水平上，可以认 
为胰岛素对血糖的作用有统计学意义 (P<0.05), 而生长素则对血糖变化无影响 (P>0.05)。 

2. f 检验无效假设为//。:戽=0,备择假设为// 1: /^0。/检验方法比 F 检验更为简便，检 
验统计量为 

，*=备 (12-10) 

其中'为偏回归系数~的标准误。 

由表 12-3 中的回归系数的估计结果，按公式 (12-10), 不的检验结果为\ =-4.31，尸=0.0005; 
X 2 的检验结果为\ = 0.84,尸=0.411。结论与方差分析检验结果相同，即胰岛素对血糖水平的作 
用具有统计学意义，生长素则未显示出其对血糖的作用。 


三、实 例 

例12_2 为了 研究影响糖尿病患者糖化血红蛋白 (HbAlc) 的主要危险因素，某研究者收集了 
糖尿病患者的糖化血红蛋内 （r, %)、年龄 U,， 岁 ) 、体重指数 U 2 , kg/m 2 )、 总胆固醇(石, mmol/L), 
收缩压 U 4 , rniriHg) 和舒张压 (X 5 , mmHg) 等数据资料。现从中随机抽取了 20例，数据见表 12-5, 
试作多元线性回归分析。 




由表 12-6 可见, 尸=7.32, 尸 <0.01， 此回归方程有统计学意义。由表 12-7 可见，自变 量不、 
不、 X 4 按 a = 0.05 水平有统计学意义，但； f, 和不 无统计学意义。 

需要注意，因为自变量之间可能存在一定的相关性，当从原方程剔除一个变量时，其他一 
些变量的回归系数可能受到影响。另外，有时需要比较各自变量的相对贡献大小，由于回归系 
数受变量度量衡的影响，不能直接比较。为此，可以对回归系数进行标准化处理，消除度量衡 
的影响，计算标准化回归系数 (standardized regression coefficient), 反映各自变量对应变量的影响 
程度。计箅公式为 



式中 ，冬和 S ) ■分别为自变量馮及应变量7的标准差，~为< 的回归系数。 

四、复相关系数和决定系数 


1.复相关系数表示回归方程中的全部自变量; f 与应变量 K 的相关密切程度。和简单相 
关系数不同的是，复相关系数 (multiple correlation coefficient) 取值总为正值，简记为 i?(0S/?Sl )o 
计算公式为 
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2. 决定系数复相关系数的平方称为决定系数 (coefficient of determination), 记为及 2 ,反映 
线性回归方程能在多大程度上解释应变量 r 的变异性。其定义为 



决定系数/? 2 反映了回归方程与数据的拟合程度，其值越接近1，说明回归方程的拟合程度 
越好； 反之，其值越接近0,说明回归方程的拟合程度越差。例 12-2 中炉=0.7232,说明由年龄、 
体重指数、总胆固醇、收缩压和舒张压可解释该样本糖化血红蛋白变异的72.32%。 

第二节多元逐步回归 

多元线性回归分析中，当自变量较多时，可能并不是所有自变量都对应变量有显著影响， 
同时有些自变量之间可能相关，存在信息重叠和共线的问题。通常情况下，更希望将有统计学 
意义的自变量引人回归方程，以使方程更为简单，容易解释。更重要的是，把不显著的自变量 
排除后可以使回归力^的残差均方减小，有利于揭示其他自变量的作用。为此可以采用三种自 
变量筛选方法，即向刖选择法 （forward selection), 向后选择法 (backward elimination) 和逐步选择 
法（ stepwise selection ) 0 

1_向前选择法方程由一个自变量开始，每次引入一个偏回归平方和最大、且具有统计学 
意义的自变量，由少到多，直到不具有统计意义的因素可以引人为止。这种方法的主要问题是， 
先进入方程的变量有可能受到后进入方程变量的影响变得不显著。 

2. 向后选择法先建立一个包含所有自变量的回归方程，然后每次剔除一个偏回归平方和 
最小、且无统计学意义的自变量，直到不能剔除时为止。这种方法在样本量比较大 ( 如《 > 100), 
或者自变量不是很多的情况下(如 w < 10) 效果较好。 

3. 逐步选择法在前述两种方法的基础上进行双向筛选的一种方法。即向前引人每一个 
新自变量之后都要重新对先前已选人的自变量进行检査，以评价其有无继续保留在方程中的价 
值。为此需要“引入”和“剔除”交替进行，直到无统计学意义的新变量可以引入也无自变量可 
以剔除时为止。 

上述筛选自变量三种方法，可以计算偏回归平方和的 F 统计量，即使用公式 （12-9) 进行检 
验和筛选。有时也采用校正决定系数 (adjusted R-square)/^ 2 作为判断标准，选择校正决定系数 
大者为“最优”方程。校正决定系数的计算公式为 

&一击一 觉 (⑽) 

式中〆 P =1,2，•••，/«)为方程中包含的自变量个数。 

在进行逐步回归前，首先应确定检验每个自变量是否有统计学意义的 F 检验水平，以此作 
为引人或剔除变量的标准。 F 检验水平可以根据具体情况而定。一般而言，若使最终的回归方 
程中包含较多的自变量， F 水平可以适当放宽些,但也不能取得太低,否则会失去筛选自变量的 
意义。一般 可将尸 值定在 ct 为0.0 5 、0.10或 0.20 水平上，同时要求 a 选人 知臟。 

逐步回归法最后得到的“最优”回归方程,与所给的临界值的选择有关，无法保证所挑选的 
回归方程在任何准则下都是最优的。回归方程是否合理需要结合专业知识进行判断。 

对例12_ 2 进行多元逐步回归，采用逐步法筛选自变量,选入水准为0.10,剔除水准为0.15, 
SPSS 软件计算过程及相应结果见表 12-8 至表12-11。 


笔记 



表 12-8 多元逐步回归结果 


偏回归系数 标准误 标准偏回归系数 



表 12-9 多元逐步回归方差分析表 



表 12-10 多元逐步回归的复相关系数和决定系数表 

模型(步骤） 

复相关系数 

决定系数 

第1步 

0.693 

0.480 

第2步 

0.751 

0.564 

第3步 

0.819 

0.671 

表 12-11 未进入方程的自变量 

模型(步骤） 

变置 标准化系数 t 

P 



最后得到的冋归方程为 


Y = 4.799 + 0.03 1尤 2 + 0.097尤 3 + 0.008X 4 






根据上述结果，可以认为体重指数本、总胆固醇不和收缩压不是影响糖化血红蛋白的主 
要因素。 

第三节多元线性回归的注意事项 

1 ■ 应用条件多 / ll 线性问归原则上要求应变量是连续型变贷，其预测值勻实际观测值的 
差值 （ 即残益服从山:态分布 • 扑旦在不同的 A' 取值上方差相同。另外，要求应变量的观测值相 
互独立，对于伶染性疾病等数据应谨愤处理。 

2. 样本含量多元线性回归既可用于大样本资料，又可用于小样本资料，但是如果方程中 
自变； fi 的个数/”较多，样本贪设《相对于 m 并不很大时，建立的回归方程会很不稳定，常常有 
较大的穴 2 ,容易造成一种假象。因此，实际计算时应注意”与 w 的比例，经验上 w 至少应是方 
程中自变 M 个数 aw 的5〜10倍。 

3. 定性变量的数量化在多元线性回归中，自变量通常是连续型变量，而对于无序分类变 
量必须数蜇化；苻序变量则可根据实际情况选择直接引入回归方程或数量化后引入回归方程。 

( 1 ) 二分类定性变量处理 方法： 如对于性别变量 AT 的赋值方法为 



(2) 多分类定性变: M： 处理 方法： 如果有 A •类，则可用々-1个取值为0或1的哑变量 (dummy 
variable) 来赋值表达，如血型分为 A 、 B 、 AB 和0型，对于血型变量义的赋值(以0型为对照)方 
法为 

X = l ^ 8 型 hi 1 ， 八 8 型 

1 lo, 其他血型， 2 其他血型， 3 |o, 其他血型 

多分类定性变量与哑变 M 取值的对应关系可用表 12-12 表述。 
_ 表 12-12 血型变量的哑变量賦值方法 

^5 分组编码 — 哑变置 

X _ G X, Xj/ x 3 

0型 】 o 0 0 

A 型 2 10 0 

請 3 0 10 

AB 型 _4_ Q _ o _1 

(3) 有卬 变切:处观方法：如病情分为“轻、中、 ff ，可以按“1、2、3” 的赋值方法直接引入回 
U」 模型。如果样本墩较大，也可按多分类定性变燈进行数量化后引人回归模型。采用何种方法 
进行赋值应视具体情况而定，一般可通过评价上述两种赋值方法的差异，选择最佳的方式引人 
回归方程 ... 

4. 多重共线性当自变最间存在较强的线性关系时，会使多元回归方程中的参数估计不 
准确，影响多元线性回归分析的结果。如研究高血压与年龄、吸烟年限、饮白酒年限等因素的 
关系，这搜肉变最通常是相关的，如果这种相关程度非常高，使用最小二乘法建立回归方程就 
有可能不合理 u 

5. 关于变量筛选变靖较多的情况下.使用逐步回！ d 分析常能使问题得到简化.较快 
地得到结艰 fH 必须指 出： 不逐步回 I门得到的结果，所谓的‘觉优 ，，【el!l | 力程 不一定 
是最好的，没有选人力•程的变超:也未必没有意义。选择不同的检验水平，其回归方程的结果可 



能不 一致； 相同的变量在不同变量组合中得到的检验 P 值也可能不同。建立回归方程时，最好 
结合所要研究的问题和专业知识确定应选择的变量。 


I 练习题 

一、 单项选择题 

1. 在疾病发生危险因素的研究中，采用多变量回归分析的主要目的是（ ） 

A. 节省样本 B. 提高分析效率 

C. 克服共线影响 D. 减少异常值的影响 

E. 减少混杂的影响 

2. 多元线性回归分析中，反映回归平方和在应变量 K 的总离均差平方和中所占比重的统 
计量是 （） 

A. 简单相关系数 B. 复相关系数 

C. 偏回归系数 D. 回归均方 

E. 決定系数 R 2 

3. 对同一资料作多变量线性回归分析，若对两个具有不同个数自变量的回归方程进行比 
较，应选用的指标是 （） 

A. 决定系数 B. 相关系数 

C . 偏回归平方和 D. 校正决定系数 

E. 复相关系数 

4. 多元线性回归分析中，反映自变量对应变量的作用大小的是 （） 

A. 决定系数 B. 标准化偏回归系数 

G. 偏回归平方和 D. 校正决定系数 

E. 复相关系数 

5. 多元线性回归分析，对回归方程作方差分析，检验统计量 F 值反映了（ ） 

A. 所有自变量与应变量间是否存在线性回归关系 

B. 部分自变量与应变量间是否存在线性回归关系 

C. 自变量与应变量间存在的线性回归关系是否较强 

D. 自变量之间是否存在共线 

E. 回归方程的拟合优度 

6. 在多元回归分析中，若对某个自变量的值都乘以一个不为零的常数，则 （） 

A. 偏回归系数不变、标准回归系数改变 B. 偏回归系数改变、标准回归系数不变 

C. 偏回归系数与标准回归系数均不改变 D. 偏回归系数与标准回归系数均改变 

E. 偏回归系数和决定系数均改变 

7. 以下不是多元线性回归模型应用必须满足的条件是（ ） 

A. 应变量与自变量存在线性关系 B. 应变量值相互独立 

C. 残差服从正态分布 D. 自变量服从正态分布 

E. 对任意一组自变量应变量具有相同方差 

8. 多元线性回归中的多重共线性指的是（ ） 

A. 应变量与自变量存在线性关系 B. 应变量与多个自变量相关 

C. 自变量之间存在线性相关 D. 应变量之间存在线性相关 






E. 应变兌与部分自变仝存在线性关系 
9. 下述不足$元线性 1’3 归应用条件的是 （） 

A •应交兑与 f;〗 ：吟存在线性关系 B. 残差服从正态分布 

c. 也：：:-•】互独立 d . y 在不同的义取值上方差相同 

E. 各自变V方&相同 

to. 现 m s 患有动脉硬化 患者的血脂，应变量为低密度脂蛋白与高密度脂蛋白含 

蛩比值 （ ;!：立的回归方程为（ ） 

) - S.S.'C ^0.014TC - 0.001 TG - 0.033ApoA+0.011 ApoB 
假如其 ilL-ia if ： ^ -S： , A P ol3 由 l(K)mg/dl 增加到 120mg/dl, K 的平均改变量是（ ） 

A. n.lH'ni-\U B. 1.248mg/dl 

C. 2(KU(M)nii;/dl D. 3.644mg/dl 

E ；. 0.22( )irag/d) 

二、计算与分析 

1. 某种特殊营养缺乏状 态下，儿童年龄（岁 ） 、身高 (cm) 与体重 (kg) 测定结果见下表， 
①试建立年龄、身岛与体 f 的二元回归 方程； ② 对回归方程作 检验； ③计算复相关系数与 
决定系激； 4 计算年龄 和身高的标准偏回归系数 


营养缺乏儿童年龄、身高、体重测定值 


编号 （/) 1 

2 3 

4 5 

6 7 8 

9 10 

11 12 

身髙 UupK 145 

150 124 

157 129 

127 140 122 

107 107 

155 148 

年龄(岁) ，馬 8 

10 6 

11 8 

7 10 9 

10 6 

12 9 

体重 (kg), y 29 

32 24 

30 25 

26 35 26 

25 23 

35 31 

2. 有学者认为，血清 中低密度脂蛋白增高和高密度脂蛋白降低，是弓 1 起动脉硬化的一 

个重要原因.现测量了 30名动脉硬化疑似患者的栽脂蛋白 A1、 

栽脂蛋白 B、 载脂蛋白 E、 

载脂蛋白 C、 低密度脂蛋白中的胆固醇、高密度脂蛋白中的胆固醇含量，资料见下表： 

( 1 ) 分别作 y, 和 K 对不、不、尤、不的多元线性回归 分析； 



(2) 作 K/r, 对不、4、不 、不的 逐步回归分析，并与前面的分析结果进行比较。 


30名动脉硬化疑似患者的观测资料 



载脂蛋白 AI 

载脂蛋白 B 

载脂蛋白 E 

载脂蛋白 C 低密度脂蛋白 

高密度脂蛋白 

序号 （mg/dl) 

(mg/dl) 

(mg/dl) 

(mg/dl) 

(mg/dl) 

(mg/dl) 

/ X, 

x 2 

x 3 


v, 

v 2 

1 173 

106 

7.0 

14.7 

137 

62 

2 139 

132 

6.4 

17.8 

162 

43 

3 198 

112 

6.9 

16.7 

134 

81 

4 11H 

138 

7A 

15.7 

188 

39 


94 

8.6 

13.6 

138 

51 

6 175 


12.1 

20.3 

215 

65 

7 I3t 

154 

11.2 

21.5 

171 

40 

8 158 

141 

9.7 

29.6 

148 

42 

9 158 

137 

7.4 

18.2 

197 

56 

10 m 

151 

7.5 

17,2 

113 

,37 
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续表_ 1 

序号 

载脂蛋白 AI 
(mg/dl) 

X' 

载脂蛋白 B 
(mg/dl) 

x 2 

载脂蛋白 E 
(mg/dl) 

x 3 

载脂蛋白 C 
(mg/dl) 

X, 

低密度脂蛋白 
(mg/dl) 

Vi 

高密度脂蛋白 
(mg/dl) 
y 2 

11 

162 

110 

6.0 

15.9 

145 

70 

12 

144 

113 

10.1 

42.8 

81 

41 

13 

162 

137 

7.2 

20.7 

185 

56 

14 

169 

129 

8.5 

16.7 

157 

58 

15 

129 

138 

6.3 

10.1 

197 

47 

16 

166 

148 

11.5 

33.4 

156 

49 

17 

185 

118 

6.0 

17.5 

156 

69 

18 

155 

121 

6.1 

20.4 

154 

57 

19 

175 

111 

4.1 

27.2 

144 

74 

20 

136 

110 

9.4 

26 

90 

39 

21 

153 

133 

8.5 

16.9 

215 

65 

22 

110 

149 

9.5 

24.7 

184 

40 

23 

160 

86 

5.3 

10.8 

118 

57 

24 

112 

123 

8.0 

16.6 

127 

34 

25 

147 

110 

8.5 

18.4 

137 

54 

26 

204 

122 

6.1 

21.0 

126 

72 

27 

131 

102 

6.6 

13.4 

130 

51 

28 

170 

127 

8.4 

24.7 

135 

62 

29 

173 

123 

8.7 

19.0 

188 

85 

30 

132 

131 

13.8 

29.2 

122 

38 

1 _一—… …—…二 ____ ( 


笔记 
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第十二章介绍的线性回！ U 可以用于分析应变量为连续型变量时，其与自变量之间的线性依 
存关系。但是在阪孚研究中应变 M 有吋是二分类结果，如发病与不发病、死亡与生存、有效与 
无效、鉍发勺未 H 发等，敁然这类变 M 不满足正态分布的条件。当需要研究二分类应变量的影 
响因索时，不适合用线性回! U 分析，这时可以采用 logistic 回归分析 (logistic regression analysis^ 
logisUc 回 IU 屈于概率咽非线性刚丄它是研究二分类(可以扩展到多分类)反应变量与多个影响 
因索之间关系的一种多变 Q： 分析方法。 logistic- 回归模型参数具有明确的实际意义，现已成为处 
理分类型数据的常用方法。 

第一节 logistic 回归 



(― )logistic 回归模型 

设有一个二值应变取值为 

F = |l， 出现阳性结果(发病、有效、死亡、复发等） 

10,出现阴性结果(未发病、无效、生存、未复发等） 

另有 w 个影响: K 取值的 A 变 、X 上、…， X m 、 观察到《例样本数据如表 13-1 所示。 


表 13-1 logistic 回归分析数据格式 


例号/ 

Xi 

X 2 … 

X m Y 

1 


X n … 

X lm 1 

2 

X 2l 

X n … 

A o 

3 

為 

知 … 

^ 1 


X nx 

x n2 … 

X 咖 o 

记在这 m 个 g 

与变贵作戶 

目下阳性结果发生的概率为 P=P(Y= 

:11A",, 石 ，不 ，…， ) ，则 logistic 


阅归模型可表示为 

P " 1 + exp [- + p x X { + fi 2 X 2 + -. + P m X m )\ (13 '° 

其中尻 称为常数项或截距， A ,爲,…，久称为模型的回归系数。若用 Z 表示 m 个自变 M 的线性 
组合 爲尤 —••+凡尤,，则 Z 与尸之间关系的 logistic 曲线如图 13-1 所示。从图中可 
以看出：， Z 趋于 时？ 值渐近于 i ;当 Z 趋于 -oo 时，尸值渐近于0; P 值的变化在 0-1 范围 
之内，并 [i 随2值的增加或减少¥ S 形变化 

对式 （13-1 )作变换， logistic IHIHI 模型可以表示成如下线性形式 

/W, + + …+ P m X m (13-2 ) 笔记 

- :- 
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式（ 13-2) 等号左端为阳性结果与阴性结果发生概率之比的自然对数，称为/>的 logit 变换，记为 
logit (尸)。可以看出，虽然概率尸的取值范围在 (M 之间， logit(/>) 却没有数值界限。 



图 13-1 logistic 曲线示意图 


(二）模型参数的意义 

为便于理解，通常以流行病学研究为例来说明模型参数的意义。如果把 logistic 模型中的尸 
看作是在某一暴露状态下发病的概率 ，则爲 表示所有暴露剂量为0时发病与不发病概率之比的 
自然对数，反映了疾病的基准状态。回归系数戽(/=1,2,…， m) 表示当因素 < 改变一个单位时 
logk(P) 的改变量，它与衡量危险因素作用大小的比数比 (odds ratio, 撕)有一个对应的关系。 

设自变量牟的两个不同取值为不 =c, 和不 = Cq ， 假定其他因素的水平相同，由流行病学的知 
i 只可知，两个不同暴露水平 A；= Cl 和。下的比数比0及 7 的自然对数为 


取反对数后可得 



(13-3) 


O/? 7 =exp[/f/c,-c 0 )] (13-4) 

式 (13-3) 中巧和分别表示在 < 取值为及 c 。 时的发病概率。特殊地，如果曷赋值为 


则暴露组与非暴露组发病的比数比为 



暴露 

非暴露 


ORj= exp (戽） (13-5) 

当灼=0时， ORj=l, 说明<对疾病发生不起 作用； 当爲>0 B 寸， ORj>l, 说明曷是一个危险 因素； 
当戽<0时，0巧< 1， 说明曷 是一个保护因素。在具体研究中可结合馮所代表的因素对其做出 
恰当的解释。 

由于值与模型中的常数项爲无关，在危险因素分析中通常 把凡看 作无效参数。对于 
发病率较低的疾病如恶性肿瘤，比数比可以作为相对危险度 (relative risk, 似)的近似估计，即 


…必-少丄狀 (13 -6) 

P 0 /O-P 0 ) P 0 

由此可见， logistic 回归模型参数有明确的实际意义，即得到某一因素的 logistic 回归系数的估计 
值后，便可以估计出这一因素在不同水平下的比数比，甚至相对危险度。这是 logistic 回归用于 
流行病学和临床数据分析的优势。 
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：1 


'、模型的参数估计 

在 logistic 回归模型中，回归系数的估计通常用最大似然法 Uaximum likelihood estimate, 
MLE)。 其避本思想是先建立一个样本的似然函数，求似然函数达到最大值时参数的取值，即为 
参数的极大似然估计值。 

样本似然函数可表示为 

乙:❿穴 1 - (13-7) 

式中尺表示第/例观察对象在自变 m •的作用下阳性结果发生的概率，若实际出现的是阳性结 
果，取否则取:^ = 0。 

为了 求出肖 L 值最大时的参数取值，通常取I的对数形式以简化计算，即 

= (13-8) 

然后用迭代方法使对数似然函数达到极大值，此时参数的取值心， b lt b 2t -,b m 即为成, A，A， …， 
K 的最大似然估计值。上述求解过程需要利用统计软件完成。 

由公式 （13-4) 可得，某因素两个不同水平 ( C| ， C 。) 比数比的估计值为 

c,-c 0 )] (13-9) 

ORj 的可信区间可以利用~的抽样分布来估计，在样本量含量较大的情况下，它近似服从正态 
分布。若 q 和 c。 分别表示暴露和非暴露，则比数比辦的1 -« 可信区间可按下式计算 

expibj - z a / 2 S b ) < ORj < expCbj + z an S b ) (13-10) 

式中\的值及可信区间可由统计软件给出。 

例 13-1 表 13-2 是一个研究吸烟 U,)、 饮酒(本)与食道癌⑺关系的病例-对照资料，试 
作 logistic 回归分析。 
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表 13-3 例 13-1 logistic 回归参数估计结果 

-5 i ―回归系数标准误~~ 0 尺值 可 翌 [ 

X _ b _ S, ____ 下限 上限 

常数项 -0.910 0.136 44.870 0.000 0.403 

吸烟 0.886 0.150 34.862 0.000 2.424 1.807 3.253 

饮酒 _ 0.526 0.157 _ 11.207 0.001 _ 1.692 _ 1.244 _ 2.303 

吸烟与饮酒的 logistic 回归系数分别为 0.886 和 0.526, OR 值及其95%可信区间分别为 
2.424( 1.807 〜 3.253) 和 1.692( 1.244-2.303 )。 

与线性回归分析相同，因为自变量的单位不同，不能用回归系数的估计值来判断哪一个自 
变量对应变量的影响最大，为此需要计算出标准化回归系数。在标准化回归系数的估计值中， 
绝对值最大的标准化回归系数对应的自变量作用最大。 

三、 logistic 回归系数的假设检验 

得到回归系数的估计值后，还需要对其进行假设检验。对回归系数的假设检验，可用来说 
明自变量对应变量7的影响是否具有统计学意义。具体分为对模型整体的检验和对单个偏回 
归系数的检验，对应的检验假设分别为 

执 = 爲，…， An 不全为0 

丑 0: 爲=0;//, :爲关 0 

常用的检验的方法有似然比检验 (likelihood ratio test)、Wald 检验 (Wald test) 和计分检验 （score 
test)。 

1. 似然比检验似然比检验的基本思想是比较在两种不同假设条件下的对数似然函数值， 

I看其差别大小。具体做法是先拟合一个不包含准备检验因素在内的 logistic 模型，求出它的对数 
似然函数值 lnL 0 j 然后把需要检验的因素加入模型中去再进行拟合，得到一个新的对数似然函 
数值 In A ，假设前后两个模型分别包含/个自变量和 p 个自变量，似然比统计量 G 的计算公式为 
G=2(lnL,-lnL 0 ) (13-11) 

当样本含量较大时，在零假设下得到的 C? 统计量近似服从自由度为 d ( d = p - l ) 的/ 分布。 
若时，表示新加入的 d 个自变量对回归有显著的贡献。如果只对一个回归系数检验，则 
d=\ Q 

由例 13-1 可以算得 

lnI(^,)=-585.326, \ nL { X 2 )=-591 A 36 t In 1(不 ，不) =-579.711 
符号 LU；) 和 LU 2 ) 分别表示模型中只含有不和 X 2 的最大似然函数值，而以不，不)则表示模 
型中同时含有不和不的最大似然函数值。 

对于 // 0: A=o; 况: 

(7=2[1111(不，不)-111/«(1 2 )]=2[-579.711 - (-597.436)]= 35.45 
査/界值表得/。,。 5 .1 = 3.84, G>3.84, 故在 a = 0.05 检验水准上拒绝风，接受#，说明平衡了饮 
酒因素的影响后，食管癌与吸烟有显著性关系。 

同理，对于 // 0: A=0;//, : A 关0 

G=2[lnX，U 1 ,X 2 )-lnZ，U,)]=2[-579.711-(-585.326)]=11.23 
G>3.84, 拒绝//„，接受//,，说明平衡了吸烟因素的影响后，食管癌与饮酒有显著性关系。 

2. Wald 检验 Wald 检验只需将各参数的估计值~与0比较，而用它的标 准误氕 作为参 
i 照，为检验爲 =o 是否成立，计算下面的统计量 ， bp 
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(13-12) 


(13-13) 

对于大样本资料，在零假设下 z 近似服从标准正态分布，而/则近似服从自由度 v=l 的/ 
分布。 

计分检验计算公式比较复杂，此处省略。三种方法中，似然比检验可以对自变量增减时所 
得到的不同回归模型进行比较，既适合单个自变量的假设检验，又适合多个自变量的同时检验。 
Wald 检验比较适合单个自变盘的检验，但结果略为保守。计分检验在小样本时较似然比检验 
统计量更接近于/分布。实际工作中应注意所使用的统计软件采用的是何种检验方法，不同的 
方法所得的结果可能不同。在大样本情况下，使用三种方法得到的检验结果是一致的。 

从表 13-3 中可以看出，吸烟和饮酒 Wald/ 值分别为 34.862 和11.207,与似然比检验的结 
果一致。 





四、变量筛选 


当对多个自变量建立 logistic 回归模型时，并不是每一个自变量对模型都有贡献。通常我们 
希望所建立的模型将具有统计学意义的自变量都包含在内，而将没有统计学意义的自变量排除 
在外，即进行变量筛选。与多元线性回归相似， logistic 回归的变量筛选的方法有向前选择、向 
后选择和逐步选择三种方法。但其中所用的检验统计量不再是线性回归分析中的 F 统计量，而 
是 logistic 回归参数检验中的似然比统计量、 Wald 统计量或计分统计量之一。多数统计软件使 
用的是似然比统计量。 

例1 3-2 某医院在研究某种药物治疗骨折效果时，收集了 516例病例资料，对每一患者采 
用相同的标准按照“好、差”做疗效评价。在评价时需要同时考虑骨折的类型、是否手术、是否 
服药和治疗时间4个因素对结果的影响。数据资料见表13~4和表 13-5, 试作 logistic 逐步回归 
分析。 


因素 

—骨折类型 
治疗方法 
服药情况 
治疗周数 
疗效评价 


表 13-4 骨折治疗效果的4个可能影响因素与编码说明 


变量名 编码说明 

X x 闭合：0,开 ]k = l 

Xi 非手术=0,手术=1 

^3 未服药= 0,服药=1 

不 1~=1, 11—2,21^3 

_ I _ 差=0,好=1 
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续表 

分层 

X, x 2 x 3 

X, 阳性数 

阴性数 

观察例数 

7 

0 1 0 

1 0 

17 

17 

8 

0 1 o 

2 3 

25 

28 

9 

0 1 0 

3 17 

15 

32 

10 

0 1 1 

1 5 

91 

96 

11 

0 . 1 1 

2 28 

21 

49 

12 

0 1 1 

3 19 

3 

22 

15 

16 

1 0 o 

1 0 o 

1 0 1 

2 0 

3 1 

1 0 

2 

3 

2 

4 

17 

18 

1 0 1 

1 0 1 

2 4 

3 5 

8 

1 

12 

6 

19 

20 

1 1 0 

1 1 0 

1 0 

2 0 

9 

13 

9 

13 

21 

1 1 0 

3 8 

5 

13 

22 

1 1 1 

1 3 

20 

23 

23 


2 7 

1 

8 

24 


3 6 

0 

6 

将治疗周数化为哑变量，见表 13-6。 





表 13-6 

治疗周数的哑变量赋值 





哑变量 




水平 

•^4-1 


不 -2 

1 0 0 

2 1 0 

3 0 1 


用 SPSS 向前选择法筛选自变量(似然比检验)，确定选入的检验水准为《 = 0.05。经过两 
步筛选，最终进入方程的自变量有服药情况和治疗周数，结果如表 13-7 所示。这两个变量回 
归系数的 Wald 检验值均具有统计学意义，提示它们是骨折治疗效果的独立影响因素。在相 
同的治疗时间条件下，服药骨折病人获得好疗效的可能性比不服药骨折病人更大，其比数比为 
10.060; 在相同的服药情况下，治疗时间越长疗效越好，其中治疗周数在 11 周以上相对于11周 
以下的比数比为 14.638, 治疗周数在21周以上相对于11周以下的比数比为116.863。 


表 13-7 例 13-2 的 logistic 回归模型自变量筛选结果 


模 型？： 标 ; 误 w ㈣ ，值 ㈤ 值 

第1步 常数项 -2, 

治疗11周 2. 

治疗21周 3. 

第2步 常数项 一 4. 

服药情况 2. 

治疗〗1周 2. 

治疗21周 4. 

.528 0, 

.149 0. 

299 0. 

647 0 

309 0 

684 0 

761 0 

238 112.433 <0.001 

289 55.267 <0.001 

323 104.602 <0.001 

422 121.502 <0.001 

355 42.174 <0.001 

310 74.842 <0.001 

.444 114.981 <0.00 ： 

0. 

8. 

27. 

0 

10 

14 

116 

080 

578 4.867 15.117 

073 14.388 50.940 

010 

060 5.012 20.192 

638 7.970 26.887 

863 48.949 279.006 








第十三章 logistic 回归分析 


M 


第二节条件 logistic 回归 


一、条件 logistic 回归的原理 

在医学研究的设计阶段，采用配对设计来控制混杂因素对研究结果的影响是常用的方 
法。如把病例和对照按照年龄、性别等条件进行匹配，形成多个匹配组。条件 logistic 回归 
(conditional logistic regression) 是针对配对或分层资料的一种分析方法。在这类资料中，每一个 
病例配以条件相似的一个 （ 1 : 1 ) 或几个 (1 :从，通常 M 幻)对照，形成一个匹配组(层)，称为1 : 1 
配对或1 : M 配对。条件 logistic 回归与非条件 logistic 回归的区别是参数估计是否用到了条件 
概率。 

设有《个病例，每个病例配以条件相似的 M 个对照，共形成 W 个匹配组，数据格式如表 13-8 
所示。 Y=l 为病例，组内编号为0; X)为对照，组内编号表示第 z •个匹配组第/(/=0, 
1,2,-, M) 个观察对象的第个危险因素的观察值。 


匹配组号 组内编号‘ 


M 

0 


为病例，其他为对照 


表 13-8 1: M 条件 logistic 回归数据的格式 
反应变置 危险因素 

Y X, X 2 


1 ^.0. x l01 

o X U2 

0 ^. 2 . X m 

i ■: : 

0 ^iMl ^M2 

1 Kta 

0 X nu 

0 X 孤 

l ' ^ :…:：； !： 

0 _ XnM\ _ X ni Q 


x m 

X l0m 

x、' m 

^I2m 

X- 

X nim 

X- 

x nMm 


用尸,表示第 / 层在一组危险因素作用下发病的概率，条件 logistic 模型可表示为 

^ = l + expL-(^ 0l + M, + 夕〆 2 + …，卜 1 ’ 2 ,…’ w (13 ' 14) 

瓜表示各层的效应，久，爲,… ，欠为 待估计的参数。与非条件 logistic 回归模型不同之处在常数 
项上，不同匹配组的爪可以各不相同，但内在假定了每个危险因素的致病能力在不同匹配组中 
相同。 、 

条件似然函数的构造 ：用不 =(知,4，”.，4)表示第 z •层内第，个观察对象危险因素的观 
察向量值，考虑第/个匹配组中的 M+ 1个观察对象有1名病例的条件下，恰好第一个观察对象 
属于病例组的条件概率为 




，=1)行尸( 


(13-15) 

笔记 
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它等于观察到的第一组危险因素属于病例而其他危险因素属于对照的概率与各种可能组合情 
况下的概率的比值。利用概率论中的条件概率公式和式 （13-14) 有 

~ nr - 1 (⑽） 

1+ Z«p 

为了估计模型的参数，构造综合《个匹配组的条件似然函数为 

M - t ( i3 _ 17 ) 

l + ZexpISA^-^oPj 

可以看出，条件 logistic 回归分析只估计了表示危险因素作用的 A 值，表示匹配组效应的常数项 
则被自动地消去了。 

对上述条件似然函数 L 取自然对数后，用非线性迭代法求出参数的估计值^0=1,2, -,m) 
及其标准误回归系数的假设检验及分析方法与非条件 logistic 回归完全相同。实际中，上 
述计算过程可以简化，直接由统计软件给岀参数估计和假设检验的结果。 

二、应用实例 


例1 3-3 上海某大学研究人员做了胃癌1:1配对设计的病例-对照研究，本例节录了其中 
40对资料，见表 13-9 和表 13-10, 试筛选胃癌发病的危险因素。 


_ mm _ 

接触有害物^ 

蛋白质摄人量分级 
新鲜蔬菜及水果摄人 
喜盐渍食物及重盐饮食 
不良饮食习惯 
吸烟 

精神因素 

胃癌 _ 


表 13-9 胃癌可能危险因素编码表 

编码说明 

X , 无=0,有=1 

X 2 0,1，2,3,4, 5( 无=0,摄入量逐级升高） 

X 3 无=0,少=1，多=2 

X , 0,1,2,3,4, 5( 不吃= 0,喜好程度逐级升高） 

X 5 0，1,2,3,4(无= 0,数量逐级升高） 

X 6 吸烟量分 x 吸烟年数分级 

不 0,1, 2,3( 分值越高负面精神因素越多） 

Y _ 对照=0,胃癌=1 __ 


表 13-10 胃癌危险因素研究1:1病例-对照研究数据表 







: 



借助 SPSS 软件进行变量筛选，采用向后选择法 (Wald 检验),得到表 13-1 1的变量筛选结果。 
在诸多危险因素中，不良饮食习惯和精神因素具有统计学意义，提示在防治胃癌的工作中应重 
视养成良好的饮食习惯，注意精神因素的调节，戒除不良嗜好。 

表 13-11 例 13-3 胃癌危险因素条件 logistic 回归筛选结果 

^ S ^系数标准误 wald/ Pffl ~ 0/? 值 区 fg _ 

X _ b _ St _ 下限 上限 

喜盐溃食物及 M 盐饮食 0.404 0.286 1.986 0.159 1.497 0.854 2.625 


第三节 logistic 回归应用及注意事项 




1 . logistic 回归分析的应用 logistic 回归分析可以用于流行病学、临床试验数据分析、药物 
或毒物的剂量反应和预测与判别等多个方面。在流行病学研究上，可以通过得到某一因索的 
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回归 系数卜 估计出这一因素在不同水平下的比数比或近似相对危险度。在临床试验数据分析 
上，目的是为了评价某种药物或治疗方法的效果，如果有其他影响效果的非处理因素(如年龄、 
病情等 ) 在试验组和对照组中分布不均衡,就有可能夸大或掩盖试验组的治疗效果，利用 logistic 
回归分析能够得到调整后的药物评价结果，使结果更加准确。在分析药物或毒物的剂量反应 
上，如果药物或毒物有多种，可以利用 logistic 模型做它们的联合作用分析，说明药物间的协同 
或拮抗作用。在预测与判别上，可以利用这一模型预测某事件发生的概率。 

2. 变量的取值与线性回归问题类似，作 logistic 回归分析时也需要考虑变量的数量化方 
法。对同一资料的分析，变蛰采用不同的取值形式，参数的含义、量值、符号及假设检验结果都 
可能发生变化。 

实际应用中，如果自变量是二分类定性变量，可以使用0或1 编码； 如果是多分类则需要化 
哑变燈的方法。当自 变量 是一个定量指标时，有三种处理 方法: 第一种方法，直接使用原始观测 
值。此法用起来比较简单，能够保持信息的完整性，在许多情况下回归效果也较为理想，假设检 
验的结果也比较可靠，但这种方法参数的实际意义不够明确，如年龄增加1岁的相对危险度可能 
没有实际意义。第二种方法，将连续变量按取值区间分成若干等级组，按 l，2，".，g 给分，然后 
按连续变量进行处理。第三种方法，将连续变量按不同区间分成 g 个组后，化作 g_l 个哑变量 
处理，使用这种方法的关键是要正确地分组，赋值方法见表13-12。需要注意的是，当 g>2 时， 
不能用常规的方法进行变量筛选，而应将 g - 1个哑变量作为一个整体，检验其是否引入回归 
模型。 


表 13-12 年龄变量离散化处理的賦值方法_ 

年龄（岁） 等级变量 _ 哑变置 _ . 

x _ g 1 f 爲 

<40 1 o 0 0 

40~ 2 1 0 0 

50~ 3 0 10 


3. 样本含量 logistic 回归的所有统计推断都是建立在大样本基础上的，因此其应用的一！ 
个基本条件是要求有足够的样本含量，样本含量愈大分析结果愈可靠。实际中病例和对照的人 
数应至少各有30〜50例，方程中的变量个数愈多需要的例数也就愈大。对于配对资料，一般样 | 
本的匹 配组数应为纳人方程中的自变 g 个数的20倍以上。 

4. 变量间的交互作用当某一自变量对应变量: T 的作用大小与另一个自变量的取值有关 
时，则表示两个自变量有交互作用。回归模型中是否要考虑交互作用主要靠专业知识。为了检 
验两个自变量是否具有交互作用，普遍的做法是在方程中加人它们的乘积项。如对表 13-6 数 
据的分析，已经选出是否用药 U 3 )、 治疗周数 U 4 ) 两个变量显著，如果在方程中加人骨折类型 ' 
(不）、治疗方法(不)和 Z=Z' 2 项，结果 Z 显著 (P=0.0088)， 说明治疗方法和骨折类型之间有交! 
互作用。 

5. 多分类 logistic 回归当应变量7是一个多项分类指标，特别是有序分类指标时，如流行 | 
病学中—些慢性病的危险因素研究，观察结果为“无 、轻中 、重 ”； 临床试验的疗效评价，结果为 

“治愈、显效、好转、无 效”； 临床影像诊断按“-、：!：、+、++”不同等级进行分类的资料，均可以采 | 
用 logistic 回归模型进行分析。有序 logistic 模型除参数模型的意义略有差别外，在使用上可以 | 
完全按照二分类 logistic 回归模型分析方法进行。 



练习题 


一、 单项选择题 

1. logistic 回归分析适用于应变量为 （） 

A . 二分类变量资料 B . 连续型的计量资料 

C . 正态分布资料 D . 正偏态分布资料 

E . 负偏态分布资料 

2. logistic 回归模型中自变量不可以直接使用的是 （） 

A . 二分类变量 B . 连续型的计量资料 

C . 无序多分类变量 D . 有序分类变量 

E . 两端无确定数值的变量 

3. 条件 logistic 回归与非条件 logistic 回归的主要差别是 （） 

A . 非条件 logistic 回归没有任何假定条件 B . 回归系数的意义不同 

C . 参数估计的似然函数不同 D . 假设检验使用的统计量不同 

E . 条件 logistic 回归要求应变量服从正态分布 

4. 欲研究糖尿病与年龄、高血压和肥胖之间的关系，不可以采用的检验统计量是（ 


B . 似然比检验统计量 
D . 方差分析尸检验统计量 


A . Wald 检验统计量 
C . 计分检验统计量 
E . 卡方检验统计量 

5. logistic 回归分析不适合应用的是 （） 

A . 是否发生疾病的预测 
C . 估计近似相对危险度 
E . 传染病的危险因素分析 

6. logistic 回归系数彦的流行病学意义是（ 

A . 比数比0 及值 
C . OR 值的自然对数值 
E . 发病率的改变量 

7. 下列资料适合作 logistic 回归分析的是 （ 

A . 身高与体重的关系 
C . 传染病发病概率的估计 
E . 不同剂量高血压药物的作用 

8. 在500名病例与500名对照的匹配病例对照研究中，有400名病例与100名对照有暴露 
史。根据此资料，可以计算出比数比咖为 （） 

A . 4 B . 20 C . 18 D . 10 E. 16 

9. logistic 回归分析，判断自变量对应变量作用大小应采用的统计量 是（ ） 

A . Wald 卡方值 B . 标准回归系数 

C . 似然比值 D . 回归系数 

E . /值 

10. 一项研究食管癌与吸烟、饮酒危险因素关系的数据分析结果表明，吸烟与不吸烟的比 
数比 OR t = 2.42,饮酒与不饮酒的比数比= 1.69,则同时吸烟和饮酒与两者皆无的 
比数比 Oi ? 值为 （） 


B . 慢性病的危险因素分析 
D . 多种药物的联合作用 


B . 相对危险度值 
D . 值的自然对数 


B . 冠心病危险因素的筛选 

D . 男性与女性肺癌发病率的比较 
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A . 4.09 


B . 2.42 


C . 1.69 


D . 4.11 


E . 0.73 




1. 某研究者欲比较三种不同药物治疗某病的疗效，病情是疗效的一个影响因素，经研 

究得到数据如下表所示，试用 logistic 回归进行分析。 



三种药物治疗不同病情的某病疗效 


药物 

病情 

有效 

无效 

甲药 

轻 

38 

64 


重 

10 

82 

乙药 

轻 

95 

18 


重 

50 

35 

丙药 

轻 

88 

26 


_ffl _43_37_ 


2. 某医师为了探讨心肌炎发生的有关危险因素，对30例心肌炎病人和30例健康对照 
者进行病例-对照研究，指标赋值及数据如下两表所示，试用 logistic 回归筛选危险因素。 


因素 

年龄 （岁) 

高血压史 
高血压家族史 
吸烟 

高血脂史 
动物脂肪摄入 
体质指数 
心肌炎 


心肌炎可能危险因素賦值表 
变童名 编码说明 

X x <40= 1, 4(M9=2,50-59 = 3, 60^4 

叉1 无 g .0, 有=1 

^3 无= 0,有=1 

不吸=0,吸=1 

^5 无= 0,有=1 

低=0,高=1 

不 <24=1,24-=2, 26-= 3 

_ Y _对照=0,病例=1_ 


心肌炎危险因素病例-对照研究数据表 


序号 X, X 2 X 3 X A X % X 7 Y 


序号 X, X 2 A-3 X, As ^7 Y 


0 0 0 2 0 


2 0 0 0 0 


笔记 







序号 X, x 2 x 3 

X, 

x s X 6 X 7 Y 

序号 4 ^ 

x A 

Xs 

Y 

25 2 0 0 

1 

10 10 

43 3 1 0 

1 

0 1 

2 1 

26 2 1 1 

1 

10 2 0 

44 3 1 0 

1 

0 0 

1 1 

27 3 1 0 

1 

0 0 10 

45 3 1 1 

1 

1 1 

2 1 

28 2 1 1 

0 

10 3 0 

46 4 0 0 

1 

1 0 

3 1 

29 2 0 0 

1 

10 10 

47 3 1 1 

1 

1 0 

3 1 

30 2 0 0 

0 

0 0 10 

48 4 1 1 

1 

1 0 

3 1 

31 10 0 

1 

112 1 

49 3 0 1 


1 0 

1 1 

32 3 0 0 

1 

1111 

50 4 0 0 

1 

0 0 

2 1 

33 3 1 1 

1 

113 1 

51 10 1 

1 

1 0 

2 1 

34 2 0 0 

1 

0 0 11 

52 2 0 1 

1 

0 1 

2 1 

35 2 0 1 

0 

1111 

53 2 1 1 


0 0 

2 1 

36 2 0 0 

1 

0 111 

54 2 1 0 

1 

0 0 

1 1 

37 2 1 1 

1 

10 11 

55 3 1 1 

0 

1 0 

3 1 

38 3 1 1 

1 

10 11 

56 1 0 1 

1 

1 0 

2 1 

39 3 1 1 

1 

0 111 

57 2 0 1 

1 

0 1 

2 1 

40 3 1 1 

1 


58 2 1 1 


0 0 

2 1 

41 3 0 1 

0 

0 0 11 

59 2 1 0 


0 0 

1 1 

42 2 1 1 

1 

10 2 1 

60 3 1 1 

0 

1 0 

3 1 

3. 为了研究高血压和肥胖与糖尿病的关系，某研究按 1:1 配对收集了 15对病人和对 

照的资料。 设不 表示高血压患病情况：0=无高血压，1=高血压； x 2 表示肥胖患病 情况： 

0=正常，1 = 肥胖； y 表示糖尿病患病情况： 

= 对照，1 =糖尿病。数据见下表 

试采用适 

当的方法进行分析。 







高血压和肥胖与糖尿病关系的1:1配对病例-对照研究数据表 


病例 

对 


对照 







X 2 

y 

1 1 


1 1 

1 0 


0 

0 

3 1 


1 i 

3 0 


0 

0 

4 1 


1 1 

4 0 


0 

0 

5 0 


1 1 

5 1 


0 

0 

6 0 


1 1 

6 1 


1 

0 

8 0 


0 1 

8 0 


1 

0 

9 0 


1 ' 

9 0 


0 

0 

10 1 

11 1 


1 1 

1 1 

10 1 

11 0 


0 

0 

0 

0 

13 1 

14 0 


0 1 

0 1 

13 0 

14 1 


0 

1 

0 

0 

15 0 


1 1 

15 1 


0 

0 

1_ _ __ J 









第十四章生存分析 


在临床试验研究中，如对慢性病、恶性肿瘤等患者的随访观察，常常需记录观察对象各时 
点上终点事件的发生情况，包括终点事件出现以及观察对象达到终点所经历的时间长短，以比 
较和评价临床疗效。生存分析 (survival analysis ) 就是将事件的终点和出现这一终点所经历的时 
间结合起来分析的一类统计分析方法。本章内容主要包括生存分析的基本概念、生存率曲线和 
Cox 回归，学习这些方法的目的在于能够合理地描述、分析和评价生存资料。 



第一节生存分析的基本概念 
一、 生存数据及其特点 


1. 生存时间指患者从发病到死亡所经历的时间长度。广义上，生存时间 (survival time ) 
可定义为从规定的观察起点到某终点事件出现所经历的时间长度，观察起点可以是发病时间、 
第一次确诊时间或接受处理 ( 治疗）的时间等，终点事件可以是某种疾病的发生、复发或死亡、 
某种处理的反应等。例如，在临床研究中，急性白血病患者从骨髓移植治疗开始到复发为止之 
间的时间间隔，冠心病患者出现心肌梗死所经历的 时间； 在流行病学研究中，从开始接触某危 
险因素到发病所经历的 时间； 在动物实验研究中，从开始给药到发生死亡所经历的时间等。在 
计算生存时间时，为便于分析和比较,需要有明确规定的时间起点和终点以及时间的测量单位。 
例 14-1 给出了一个记录乳腺癌患者从手术到复发的生存时间数据。 

例 14-1 为了解乳腺癌患者手术后的复发情况,.某研究者对某医院 1999-2009 年间的乳 
腺癌手术患者进行了随访研究。随访起始时间为1999年1月1日，截止时间为2009年5月31 
日。 以手术时间为观察起点，直至患者出现复发 ( s tam s = l 为复发，0为删失)，并记录每个研究 
对象的年龄 ( age , 岁 ） 、病理类型 ( type = 1为浸润性非特殊癌, 2为其他)、淋巴结转移 ( nod e = 1为 
有，0为无）、肿瘤直径 （ S ize = 1为 《2 cni , 2为 2~5 cm , 3为 >5 cm ), 生存时间 （ time , 月），摘取其中 
7例随访记录见表 14-1 „ 


表 14-1 乳腺癌患者生存资料原始记录表 


type node size 
1 0 2~ 

1 1 2 

2 0 2 

2 0 1 

1 1 2 

1 1 2 

1 0 2 






2003-09-06 

2006-02-09 

2006-02-17 

2003-09-30 

2005-12-22 

2001-07-20 

2003-07-25 


2004-05-19 

2008-02-01 

2009-04-24 

2009-04-25 

2008-07-01 

2003- 07-21 

2004- 11-15 



2. 生存数据生存数据 （survival data) 包括完全数据 (complete data) 和删失数据 （censored 
data)。 完全数据提供的是准确的生存时间，如例 14-1 中1~4号患者的生存时间均为完全数据。 
删失数据也称截尾数据，是由于某种原因而无法准确观测到生存时间的数据，如5~7号患者的 
生存时间为删失数据。 





产生删失数据的主要原因有 ：①研 究结束时终点事件尚未发生，如图 14-1 中的第4号观察 
对象，在研究计划规定的随访时间时仍未发生死亡 事件； ②失访，即由于观察对象搬迁等原因 
而未观察到终点，如图 14-1 中的第3号观察 对象; ③研究对象因死于其他原因或严重药物反应 
而终止试验和观察。 

删失数据的表示 方法： 为区别于完全数据，常在删失数据右上角标记“+”，表不蕊实的生存 
时间未知，只知道其生存期比观察到的删失时间要长。如例 14-1 中2号患者的生存时间为24, 
而6号患者的生存时间为24 + 。虽然删失数据所提供的生存时间信息不完全，但这类数据还是 
提供了部分信息，即说明观察对象至少在已经经历的时间长度内没有发生终点时间，因此，对 
于删失数据，既不能随意弃之，又不能同完全数据那样对待，这就：要采取专门处理这种资料 
的统计方法即生存分析。 

图14^1为随访研究中常见的生存时间原始记录示意图，阁中“ X ”表示终点事件“死亡”， “ O ” 
表示失访、退出研究或死于与本研究无关的其他原因。以开始治疗为起始事件，观察对象1、5 
号在规定的观察期间内发生了死亡，其生存时间为完全数据；观察对象2号是在观察终点之后 
才发生死亡事件，3号和4号分别为失访和研究结束时尚未发生死亡，则这3名观察对象的生存 
时间为删失数据。 



起始点 


终点 时间 


图 14-1 生存时间原始记录示意图 

归纳生存数据的主要特点，即同时考虑生存结局和生存时间、并且可能含有删失数据，生 
存时间通常不服从正态分布。 


二、生存分析常用统计指标 


1. 生存率生存率 (survival rate) 又称生存函数 (survival function ), 表示观察对象的生存时 
间 r 大于某时刻/的概率,常用负 /) 表示，其估计值为 


S(.t)= P(T>t) = 


/时刻仍存活的例数 
观察总例数~~ 


上式是无删失数据时估计生存率的公式，若含有删失数据，则需要分时段计算牛存概率。假定 
观察对象在各个时段的生存事件独立, < S ( /) 的估计公式为 


S(0=P( T>t k )=P\Pi'''pk=S{t k . x )p k 


(14-2' 


式中1，2,…， A :) 为各分时段的生存概率，故生存率又称累积生存概率 ( c Umu laii ve probalMlit ) 
of survival ) 0 

2. 中位生存期50%的个体尚存活的时间称为中位生存期 （median survival time ), 又称作 
半数生 存期。 中位生存期越长，表示疾病的预后越好；反之，中位生存期越短，预后越差、，中位 
生存期可以根据生存率曲线得到，生存曲线纵轴生存率为50%吋所对砬的横轴生存时间即叶 
位生存期。 






3. 风险函数生存时间已达到/的观察对象在时刻/的瞬时死亡率称为风险函数 （hazard 
function), 又称为危险率函数，常用 M/) 表示，即 



当1时， h ( t )~ P ( t ^ T < t + 即 /;U) 近似等于/时刻存活的个体在此后—个单位时段内 


的死亡概率。 

风险函数随时间的延长可呈现递增、递减或其他波动形式，当风险函数为常数时，表示死 
亡速率不随时间而加速，如果风险函数随时间上升，则表示死亡速率随时间而加速，反之亦然。 


第二节生存率曲线及比较 


生存率的估计方法有非参数法和参数法。在非参数方法中又分为寿命表法和 Kaplan-Meier 
法 （K-M 法，也称乘积极限法），二者均应用定群寿命表的基本原理，先求出各个时段的生存概 
率，然后根据概率乘法定理计算生存率，但前者往往适用于大样本资料，对于小样本或大样本 
且有精确生存时间的资料一般采用 Kaplmi-Meiei •法，本节介绍 Kaplan-Meiei •法。 

-- 、 Kaplan - Meier 生存率曲线 

(― ) 计算生存率 

Kaplan-Meier 生存率曲线由 Kaplan 和 Meier •于1958年首先提出，它是一种估计生存率的非 
参数方法。 

例 14-2 某研究者收集了 15例乳腺恶性肿瘤直径小于或等于 2 cm 的患者和21例肿瘤直 
径大于 5cm 患者手术后的生存资料，定义从手术后到患者复发的时间为生存时间（月）,试估计 
两组的复发率。 


肿瘤直径 10 

68 + 

肿瘤直径 > 5cm 5 

_ 25 


88+ 95* 

13 13 

27 28 


30 

19 

52 


21 

60 


以肿瘤直径 《2cm 组为例，计算步骤 如下： 

⑴将生存时间 U) 由小到大顺序排列，若完全数据与删失数据相同，则删失数据排在完全 
数据之后，见表14_2第 (2) 栏。 

(2) 列出时间区间 U, / i+l ) 上的复发数4和删失数 c,, 见表 14-2 第(3)、(4)栏。 

(3) 计算恰在每一时刻之前的生存人数，即期初例数计算时应减去小于4的复发数和 
删失数，即 ”产”卜卜 re "， 见表 14-2 第 (5) 栏。 

(4) 计算各时间区间上的复发概率免和生存概率 A， 见表 14-2 第(6)、(7)栏 c 

= (14 — 4) 

(5) 计算生存率灸()。活过某时刻/的生存率是其对应的各时点条件生存率的连乘积，即 

= U4-5) 

值得汴总的是， H 介删火数据的条件死亡率为0,而其 条件也 存率必为丨，所对应的生存率必然 
i m •个删失值的牛 .# 率 相同。 各患者的少存率见表 14-2 第 (8) 栏如乳腺肿瘤小于等 ]• 
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2cm 患者18个月时生存率为 0.862x0.917=0.790, 30个月时生存率为 0.71 1 x 0.889 = 0.632,佘 
类推 。 

(二）计算生存率的标准误 
Greenwood 生存率标准误近似计算公式为 




见咖〉 ]= 。. 79 。 々1 5 乂-1， 1^^ + ：^(1 1 3-1 ) + - 12乂- 1 广 0108 


根据上述计算的生存率及其标准误可估计总体生存率的可信区间。其方法是采用正态分 
布的原理，用下式来进行估计。 

SCOiz^SELSCt,.)] (14-7) 

采用该式时，生存时间末端值的可信区间可能会出现超岀[0, 1 ] 范围的不合理情况，此时可采 
用对数变换的方法进行计算，具体详见相关书籍。 


表 14-2 乳腺肿瘤直径 <2cm 组生存率计算表 


序号时间（月) 


复发数删失数期初例数 复发概率 生存概率 

d； c, n, q f p, 

(6)=(3)/(5) (7)=l-(6) 


标准误 
肪 [ 左 ⑹] : 


0.064 

0.064 


0.253 

0.253 

0.253 


(三）绘制生存曲线 

以随访时间为横轴，生存率为纵轴，将各个时间点所对应的生存率连接起来的一条曲线即 
为生存曲线。 Kaplan-Meier 法对所有死亡时点估计生存率，其生存率曲线呈阶梯式的变化。曲 
线高、下降平缓表示高生存率或较长生 存期； 曲线低、下降陡峭表示低生存率或较短生存期。 
图 14-2 为肿瘤小于或等于 2cm 和肿瘤大于 5cm 组(计算表略)的生存曲线，结果显示前者的生 
存率高于后者。 

生存曲线纵轴生存率为50%时，所对应横轴生存时间即半数生存期。从图 14-2 中可以直 
I 观地看出肿瘤大于 5cm 组的半数生存期大约为23个月。 




20 40 60 80 100 

复发时间(月） 

图 14-2 乳腺肿瘤 <2cm 和乳腺肿瘤 >5cm 组生存曲线 


••、生存率的比较 


两组或多组生存率比较是生存分析的主要内容之一。生存率组间比较实际上是两条或多 
条生存曲线的比较。生存率的假设检验方法有参数法和非参数法两类，非参数法对资料的分布 
没有要求，使用范围较广，以下主要介绍非参数法中的 log-rank 检验和 Breslow 检验两种方法。 

() log-rank 

log-rank 检验又称 Mantel-Cox^, 其基本思想是，当检验假设万 o( 即比较组间生存率相同） 
成立时，根据在各个时刻尚存活的患者数和实际死亡数计算理论死亡数，然后将各组实际死亡 
数与理论死亡数进行比较，其检验统计量为 

/ = E^ r -T , t=1 , 2 ,..., g (14-8) 

式中毛和7；,为各组在时间上的实际死亡数和理论死亡数， g 为组数，7^=«以/»，，第 * 组的方 
差估计值为 

匕:钟-?1贷) 4 (14 " 9) 

检验统计量/近似服从自由度 1) =^-1的/分布。当各组生存率相同时(祐为真)，实际死亡数 
和理论死亡数较接近，则〆值较小,可按相应自由度査/界值表得到尸值，作出推断结论。 

例 14-3 根据例 14-2 资料,试比较两种不同肿瘤直径患者术后的生存率有无差别？ 

分析步骤如下： 

1. 建立检验假设，确定检验水准 

H o ： S,(0=s 2 (r), 即两种不同肿瘤直径的患者术后生存曲线相同 
即两种不同肿瘤直径的患者术后生存曲线不同 

a=0.05 

2. 计算统计量； r 2 值 

(1) 时间 排序： 将两组生存时间混合后由小到大统一排序，对删失数据的处理同前。《| ( 、 
»2, 分别表示两组观察患者数，心、<4.分别表示两组在不同时间点上的复发数， 
^=<4+(4; C„、 C2( 分别表示两组在不同时间点上的截尾例数。计算结果列于表 14-3 中。 

(2) 计算理论数及其方差：在执成立的条件下,计算各组理论(期望)复发数及其方差。如 
生存时间为5个月时，肿瘤 S2cm 组的观察人数为15,两组合计观察人数及复发人数分别为36 



肿瘤 > 5cm 组的理论复发数和方差为 


^,=lgi = 0.417^,=3|x(l-^)x(—)x1 = 
&复发数和方差为 

^，。. 583 心|+|>〔飼- 


其余类推，结果见表1冬3的第 (6) .⑺和 （ 11 )、（ 12) 栏。 




(3) 计算统 计量： 由表 14-3 中两组总的实际复发数和理论复发数以及总的方差估计值，根 
据式 （14-8 ), 按肿瘤 S2cm 组计算得到统计量为 

, C9-15.695)： = ,. n , 


= 6.304 


同理，或按肿瘤 >5cm 组计算可得 

, (21-14.305) 2 — 

Trn 

3. 确定概率，作出统计推论查/界值表(附表 7) 得/。.„ 5 . 1 =3.84,/><0.05,按《=0.05水准， 
拒绝风，接受,可认为两条生存曲线不同，肿瘤直径 《2cm 患者的生存率高于肿瘤直径 > 5cm 
患者。 

(二） Breslow 检验 

Breslow 检验又称广义 Wilcoxon 检验或 Gehan 比分检验，/统计量计算公式为 




= ― ~， 


ifc=l,2，.’g 


(14-10) 


式中式,、7；,•和^意义同前， g 为组数， w, 为权重， Breslcm 检验取叫=以 w f = 1时为 log-rank 检 
验)。在 //o 成立的条件下，检验统计量/近似服从自由度为 v=g-l 的/分布。如对例 14-2 资 
料采用 Breslow 检验，;= 4.462, P< 0.05 ，结论同 log-rank 检验。 

由于叫随生存时间逐渐减小，所以 Breslow 检验给组间死亡的近期差别更大的权重，而 —- 
rank 检验给组间死亡的远期差别更大的权重，即前者对近期差异敏感，而后者对远期差异敏感。 
另外，需要 注意： 两种方法的应用条件相同，即各组生存曲线呈比例风险关系，生存曲线不能有 
交叉。通常情况，在生存曲线有交叉时，不适合做生存曲线的整体比较。 


第三节多变量 Cox 回归分析 


前述方法属于单变量生存分析方法。在多变量分析情况下，由于生存分析中的应变量需要 
同时考虑生存结局和生存时间，而生存时间不服从正态分布，同时可能含有截尾数据，因此多 
元线性回归和 logistic 回归都不适合对生存数据进行多因素分析。对此可以使用 Cox 比例风险 
回归模型 （Cox proportional hazards regression model, PHREG), 简称 Cox 模型。这一模型由英国统 
计学家 D.R.Co X 于1972年提出，在医学多变量生存分析中得到广泛的应用。 


一、 Cox 回归模型 


(一） 模型的基本形式 
Cox 回归模型可以表示为 

hU,X)=h 0 (t)exp(fi l X l +fi 2 X 2 +-+fiJC m ) (14-11) 

其中义)为观察对象生存到/时刻的风险函数不，…,义)是可能与生存时间有关 
的 w 个自 变量； A。 ⑴为不=不=…=总= 0时在/时刻的风险函数，称为基础风险函数;， 
爲，…， AJ 为 Cox 模型的回归系数，是一组待估计的参数。 

(二） 模型参数解释及相对危险度计算 



Cox 模型回归系数爲•(/ =1，2,-，m) 表示当因素 X 改变一个单位时 lnl>(n)/；7。 ⑺]的改 
变量，它与衡量危险因素作用大小的风险比 (hazard ra tio，ifK) 有一个对应的关系。 

设自变量不的两个不同取值为不 =c, 和不=〜假定其他因素的水平相同，两个不同暴露水 
平馮= Cl 和不= c 。下的风险比/%•的自然对数为 



= 〔私 + 客 f ， j-^o+ 


= ^ y (c,-c 0 ) 

疒表示另夕卜-组自变量取值。取反对数后可得 

HRj = exp [ ^y( c, - c 0 ) ] ( 14-14) 

特殊地，如果不赋值为1或0,分别表示暴露和非暴露两个水平，则其风险比为 

HRj = exp ( fij ) (14-15) 

当爲= 0时， = 1，说明 <对生存时间不起作用；当爲>0时,/叫> 1，说明 A； 是一个危险 因素； 
当 fij <0 时，册产1， 说明馬是一个保护因素。在具体研究中可结合馬所代表的因素对其做出 
恰当的解释。 

现举一个简单例子说明。乳腺癌患者手术后是否复发的时间与是否化疗有关，以义=1表 
示接受化疗，尤=0表示未进行化疗，得到I的回归系数々=-0.380,则接受化疗患者的风险为 
/»,(/)= h 0 ( t)exp(fix )= h 0 ( t )exp( -0.380 x 1 )=0.68A 0 (O 
未进行化疗患者的风险为 

h 2 (t)=h 0 ( t)exp(fix)=h 0 ( / )exp( -0.380 x 0 )= A 0 ( / ) 

两者的风险比为 

HR= = exp(-0.38)= 0.68 

h(J t X = 0) 

即接受化疗的患者其复发风险是未进行化疗患者的 0.68 倍，或未进行化疗的患者其复发风险是 
接受化疗患者的 1.47 倍。 

二 模型的参数估计及其假设检验 

由于式 （14-11) 对 &(/) 未作任何假定，所以不能用普通的最大似然法来估计回归系数 yff， 对 
此可以构造偏似然函数 (partial likelihood function), 并引用最大似然法进行估计。 

参数检验的零假设为//。:爲= 0。与 logistic 回归相似， Cox 回归常用的检验方法有似然比检 
验、 Wald 检验和 Score 计分检验。三种检验方法均为/检验，自由度为模型中待检验的参数个 
数。具体检验方法及变量筛选过程参见第十三章。 

三、应用实例 

例 14-4 为探讨乳腺癌患者手术治疗的预后，某研究者收集了 68例患者的生存时间、生存 
结局及影响因素。影响因素包括患者年龄、病理分型、淋巴结转移、肿瘤大小、化疗、绝经，生存 
时间以月为单位。变量的赋值和收集的相应资料分别见表1冬4和表14-5。 

对表 14-5 数据，取岣人 = 0.05 3雜= 0.10,经逐步选择法对6个变量进行筛选， Cox 回归分 
析结果见表14-6。 





表 144 乳腺癌手术治疗的预后影响因素及賦值 


— 一 因琶— 
~~~~~ 

病理分型 
淋巴结转移 
肿瘤大小 
化疗 
绝经 
生存时间 
生存结局 


变置名 _ 賦值说明 _ 

~~x x (F) 

x 2 非浸润型=0,浸润型=1 

X 3 否=0,是=1 

Xt <2cm=0,3~5cm= 1, >5cm=2 

X s 否 =0, 是 =1 

X 6 否 =0, 是 =1 

t (月） 

_ Y _ 删失=0,复发=1 _ 


表 14-5 68例乳腺癌患者手术后的生存时间（月 ） 及影响因素 


No. 

X, 

x 2 

X 3 X, X 5 

x 6 

t Y 

1 

56 

1 

0 2 1 

1 

9 0 

2 

32 

1 

1 1 1 

0 

25 0 

3 

81 

0 

0 1 0 

1 

39 0 

4 

35 

0 

1 1 1 

0 

6 0 

5 

41 

1 

1 3 0 

0 

13 1 

6 

52 

1 

1 3 1 

0 

26 1 

7 

49 

1 

0 2 1 

0 

86 1 

65 

46 

1 

1 2 0 

0 

2 1 

66 

55 

1 

1 3 1 

1 

3 0 

67 

33 

1 

0 1 1 

0 

20 0 

68 

64 

1 

0 3 1 

1 

28 1 

注 ：完整 数据见网络增值服务 






表 14-6 

68例乳腺癌患者 Cox 回归分析结果 


变置 


SEip) 

Wald/ P 

HR 

95%CI(HR) 


1.550 

0.518 

8.944 0.003 

4.711 

(1.706,13.008) 

X, 

0.959 

0.297 

10.434 0.001 

2.609 

(1.458,4.668) 


分析结果显示，淋巴结转移和肿瘤大小的回归系数均为正值,说明它们是影响乳腺癌患者 
术后复发的危险因素。在肿瘤大小保持不变的情况下，有淋巴结转移者的复发风险是无淋巴结 
转移者的 4.711 倍； 同样，在淋巴结转移保持不变的情况下，肿瘤大小每增加一级，复发风险增 
加 2.609 倍。 


四.注意事项 

1. 在研究设计时，应根据研究目的明确规定所研究生存时间的终点事件和起始事件，由于 
终点事件和起始事件是相对的，所以，一且确定,则不能在研究过程中随意改变它们。 

2. 研究的样本含量一般在40例 以上； 当协变量增加时也应适当增加，要求样本含量为观 
察协变量的5~20 倍； 两组资料比较时,最好两组例数基本一致。在随访观察时，要尽量避免观 
察对象的失访，截尾数据过多容易造成研究结果的偏倚。 

3. 进行 Cox 回归分析时,要求资料满足比例风险恒定假定,若资料不满足此假设,说明某些 
危险因素的作用强度随时间而变化,使得相对风险函数也随时间而改变。检验这一假定条件的 
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方法可以根据变量分组的 Kaplan-Meier 生存曲线是否交叉进行判断。如果数据不满足比例风险 
的假定，则需要采用时变 (time-dependent) 协变量模型或非比例风险模型 （non-proportional hazard 
model) 进行分析，具体内容可以参考有关书籍。 

4. 0«分析结果中的偏回归系数不能直接用于比较不同因素的影响大小，需通过标准化回 
归系数进行比较，一般的统计软件能够直接给出其估计值。 ， 


练习题 

一、 单项选择题 

1. 进行生存分析时，不属于截尾数据的是（ 
A. 随访期内死于本病者 

C. 随访结束时仍存活者 
E. 随访期内拒绝应答者 

2. 生存分析中的生存时间是 （) 

A. 观察开始至终止的时间 

C. 出院至失访的时间 
E. 确诊至失访的时间 


B. 随访期内死于其他病因者 
D. 随访期内找不到者 


B. 观察开始至失访的时间 

D. 观察起点到终点事件出现的时间 


3. 生存分析中，描述生存时间的集中趋势宜用的指标是 （） 
A. 算术平均数 B. 几何均数 


C. 中位数 


D. 百分位数 


E. 众数 

| 4. 不宜作生存分析的情况是 （） 

1 . A. 女性乳腺癌患者手术之后的存活时间 
e 患者确诊肝炎后肝功能异常的持续时间 
E. 妇女节育器在宫内保存的有效时间 
| 5. 生存曲线下降的坡度越陡，表示的是 （） 
A. 生存概率越大 
C, 生存时间越短 
E. 生存率越提高越明显 
I 6. Cox 回归的应变量是（ ） 

A. 生存时间 
C. 生存时间和结局变量 


B. 患者胃出血的持续时间 

D. 观察起点到终点事件出现的时间 


B. 生存时间越长 
D. 与生存时间无关 


B. 结局变量 
D. 生存率 


E. 死亡概率 


7. Kaplan-Meier 法属于 （） 
A. 参数法 

C. 半参数法 
E. 相关分析法 

8. log-rank 检验法属于 （） 
A. 参数法 

C. 半参数法 
E. Breslow 检验法 


B. 非参数法 
I).回归分析法 


B. 非参数法 
D. Cox 回归法 



9. 风险比 ///? 指的是 （） 



A. 两种不同条件下死亡概率之比 

B. 两种不同条件下生存概率之比 

C. 两种不同条件的危险率函数之比 

D. 死亡率与生存率之比 


E. 死亡概率与生存概率之比 



10. Cox 回归模型中的回归系数表示的意义是( 

) 


A. 模型预测能力大小 

B. 危险因素相对作用大小 


C. 自变量能够解释应变量的百分比 

D. 自变量不同取值出现结局的风险比 

E. 一组自变量取值时出现结局的风险 



二、计算与分析 




1. 用某中药结合化疗（中西治疗组）和化疗组（对照组）两种疗法治疗某种恶性肿瘤 

后，随访记录各观察对象的生存时间（月）如下，“+”表示删失数据，试用 K-M 法估计两种 

疗法的生存率，并比较两组疗法生存率是否有差别？ 


中药组10 

2 + 12 + 13 18 6 + 19 + 

26 9 + 8 6 + 43 + 9 4 31 

24 

对照组2 + 

13 T 11 + 6 1 11 3 

17 7 


2,某研究者拟研究影响卵巢癌患者术后生存时间的有关因素。观察了 26名卵巢癌 

患者，记录的观测指标及观测值如下表，试进行 Cox 回归分析。 



各指标数据赋值表 


指标 

含义 

赋值或单位 


X' 

年龄 

岁 



细胞分化程度 

1=高分化2=中分化3= 

低分化 

^3 

淋巴细胞浸润程度 

1 = 1 级2=11 级 3=ffl 级 



手术病灶残留量 

era 


t 

生存时间 

月 


Y 

生存结局 

0= 删失 1= 死亡 


26 名卵巢癌患者生存时间及观察数据 

编号 

X , x 2 x 3 

X, t 

Y 

1 

67 2 3 

8.4 1 

1 

2 

50 3 3 

5.5 3 

1 

3 

60 1 3 

2.3 5 

1 

4 

53 2 3 

5.1 8 

1 

5 

47 2 3 

13.7 10 

1 

6 

48 3 3 

9.3 12 

1 

7 

56 3 3 

33.3 13 

I 

8 

50 3 3 

5.9 15 

1 

9 

43 3 3 

4.6 15 

1 

10 

61 2 3 

19.2 15 

1 

11 

46 3 3 

4.1 17 

1 

12 

54 3 3 

3.2 19 

1 

13 

63 3 1 

3.9 24 

1 

14 

42 3 3 

4.8 24 

1 

— 









第十五章实验设计与临床试验设计 


医学研究中，无论是临床试验还是动物实验，都需要根据研究目的，制定研究方案，进行科 
学合理的设计。周密的研究设计，既能够节省人力、物力、财力和时间，又能够使研究因素的效 
应得以充分体现，获得准确、客观的结果，得出科学的结论。本章着重介绍实验设计的三要素 
和三原则，同时介绍临床试验设计及统计分析方法。 

第一节实验设计的三要素 

实验设计 (experimental design) 是指研究者根据研究目的和条件，结合统计学要求，合理安 
排各种实验因素，严格控制实验误差，最大限度地获得丰富而可靠的数据。实验性研究包括动 
物实验和临床试验，通常情况下， 直接 对人体进行的研究称为试验 (trial)。 实验研究的基本要素 
包括研究对象、处理因素和实验效应三个部分。 

、研 究对象 

研究对象（ study subject) 是指根据研究目的而确定的观察总体，也称为受试对象或实验对象 
(experimental subject ) 0 研究对象可以选择动物或人，也可以是组织、细胞等，无论选择什么，在 
实验开始前必须对研究对象的条件做岀严格的规定，以保证其同质性。 

1. 研究对象应具有明确的纳入标准和排除标准在医学研究中，首先根据研究目的确定 
研究对象，并且对研究对象的条件作严格的规定，即制定严格的纳人标准和排除标准，以保证 
其同质性。如动物实验时，需要考虑动物的种属和品系，同时还要注意性别、体重和窝别等，使 
其具有可比‘1^，因为这些条件可能影响实验结果。进行临床试验时，应根据研究目的拟定严格 
的纳入排除标准，如临床诊断、病情、年龄、是否有其他疾病等，对受试对象进行筛选，确保研究 
顺利进行。 

2. 选择对处理因素敏感性强的研究对象如研究致畸作用常选择大鼠。临床试验中，如 
研究某新药对冠心病患者心律失常的疗效，应选择心律失常经常发作的冠心病患者作为研究 
对象，而排除偶然发作的短暂心律失常的患者，因为他们在观察期内对该药的治疗很可能没有 
反应。 

3. 选择依从性好的患者作为研究对象临床试验要选择那些能够服从试验安排并坚持合 
作的患者；否则，若不依从的数量较大，就会影响研究结果的准确性，导致研究结果出现偏倚。 

4. 注意医学伦理学问题研究者应以患者的利益为最高准则，由受试者或其法定代理人 
在知情同意书上签字并注明日期，执行知情同意过程的研究者或其代表也需在知情同意书上签 
名并注明日期。在执行过程中，当科研与治疗发生冲突时，要服从医疗上的需要，这样做才符 
合医学伦理学要求。在动物实验中，也要注意善待动物。 

.、处 理因素 

处理因素 （treatment) 又称研究因素 (study factor), 是指根据研究目的而施加于研究对象的干 
预措施，如研究某降压药的效果，降压药是处理因素，高血压患者为研究对象。处理因素在实验 
中所处的状态称为因素的水平 (level)， 亦称处理水平。如比较某陶旨药三组不同剂量及安慰剂 
对照的降脂效果，该研究只有一个处理因素，共有4个不同水平，包括3个剂量和1个安慰剂。 
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在实验过程中，除处理因素外也能使受试对象产生效应的因素属于“非处理因素”，每一项 
医学实验研究都可能受到非处理因素的影响。由于它可能干扰处理因素与效应间的关系，成为 
I “混杂因素”，在进行实验之前，研究者有必要经过周密的思考，做出合理的实验设计来控制这 
I 些非处理因素，以排除非处理因素对处理因素的干扰。有时，即使设计时能够考虑到这些非处 
I理因素，但实践中对这些非处理因素很难加以严格控制，其实验结果仍不免会受到影响，对此 
I可以用统计学方法加以分析和校正，分离出非处理因素对实验结果的作用，发现真正的实验效 
I 应，做出客观的结论，但统计学方法对非处理因素的校正作用是有限的，不能忽视严格的实验 
设计。 

在确定处理因素时，需注意以下 两点： 

1. 处理因素要标准化处理因素在整个实验过程中应始终保持不变。在设计中应将处理 
I 因素的实施方法规定得具体、细致。其目的是使处理因素在实验过程中保持稳定，有利于分析 
I处理因素与实验结果之间的关系。例如，应明确给出受试对象的处理次数、每次的剂量，对化 
I 学试剂应规定试剂的生产单位、批号、纯度和配制规范；观察药物疗效应具体规定采集病人尿、 

!血样本的时间及间隔等。在新药临床试验中，药物要固定生产厂家，药物成分、性质、批号、剂 
I 量应一致，保存方法应 相同； 在评价手术疗效时，要求手术操作者的熟练程度自始至终保持恒 
| 定，否则将会对实验结果产生影响。 

2. 明确处理因素和非处理因素处理因素是根据研究目的而确定的。实验中的处理因素 
I不宜过多，非处理因素在对比组中要保持均衡，找出重要的非处理因素，加以控制，这样才能排 
!除非处理因素的可能混杂与干扰作用，突出处理因素的主要作用，使处理因素的效应得以分离， 
i 保证医学实验研究的成功。 


三、实验效应 

实验效应 (experimental effect) 是处理因素作用于受试对象产生的反应和结果，通过具体的 
观察指标来表达。如果指标选择不当，未能准确地反映处理因素的作用，所获得的研究结果就 
缺乏科学，性，因此选择恰当的观察指标是关系研究成败的重要环节。 

1. 主观指标和客观指标选用的指标要尽量客观，客观指标不易受主观因素影响。如电 
生理以及大多数临床化验数据(如血糖、甘油三酯、胆固醇等)都是客观指标，如果研究的指标 
是通过研究对象回答或描述症状得到，以及研究人员自行判断或医生通过体征检查的项目 ，一 
般都属于主观指标。主观指标易受研究对象和研究人员的心理状态、启发暗示和感官差异的影 
响，在实验设计中应尽量不作为主要指标。在实验设计中，若一定要采用主观指标，就必须采 
取措施以减少或消除主观因素的影响。如评价镇痛药物的效果，需要借助病人疼痛程度的主观 
描述加以反映，可以采用一定的措施来量化主观指标，如借助疼痛测量尺，尺的正面为微笑符 
号（不痛 ） 到悲伤符号(非常痛），在两者之间设置游标，面向受试对象，让其根据疼痛感觉划动 
游标，选择两个等级之间的某个位置；而尺的背面为0~10的评分，反映疼痛由轻到重的等级， 
面向测试者，根据病人所划动的游标位置进行记录，由此采用统一的标准，将病人的主观疼痛 
感觉量化，减少病人的主观影响。 

2. 选择灵敏度和特异度高的指标灵敏度是指某处理因素存在时，所选指标能够反映处 
理因素的效应程度，即反映指标检出真阳性的能力。灵敏度高的指标可以减少假阴性率，而灵 
敏度低的指标不能充分地反映处理因素的作用，如治疗慢性脂肪肝选用谷丙转氨酶、谷草转 M 
酶作为疗效指标就不敏感，因为这些指标都是急性指标，并不是所有慢性脂肪肝患者这些指标 
都表现为异常，而 B 超或 CT 影像则随病情的变化而变化，可以较敏锐地反映出治疗的作用。特 
异度是指某处理因素不存在时所选指标不显示处理效应的程度，即反映指标鉴别真阴性的能 
力。特异性高的指标能较好地揭示处理因素的作用，不易受混杂因素的干扰，可减少实验结果 
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的假阳性率，如乙型肝炎抗病毒治疗中，研究的主要指标为 HBV-DNA, 其值小于 10 2 (IU/ml) 即I 
为阴性，表明乙肝病毒处于低复制状态。因此，所选指标最好同时具有较高的灵敏度与特异度。 

3. 观察指标的准确度和精密度准确度 (accuracy) 是指研究结果与相应测定事物真实情况 | 
符合或接近的程度，主要受系统误差的影响。精密度 (precision) 是指相同条件下对同一对象的I 
某项指标进行重复测量时，观测值与其均值的接近程度，主要受随机因素的影响。精密度有两 | 
重 含义： 一是仪器设备本身具有的精度，另一种是指在反复测试过程中应控制的精度，它可以丨 
通过制定操作规范和技术培训进行控制。无论是准确度还是精密度，其水平高低都显示了研究 | 
工作质量的好坏，一般要将其控制在专业规定的容许范围内。 

第二节实验设计的三原则 

在医学实验研究中，由于存在各种非处理因素的干扰，可能使实验结果产生偏倚。 为 了减' 
少偏倚，研究设计时，必须遵循实验设计的基本统计原则，即对照原则、随机化原则和重复原则。 1 

一 、对照原则 

对照 （control) 是指在实验中应设立对照组，其目的是通过与对照组效应对比鉴别出实验组 i 
的效应大小。只有设立了对照组，才能消除非处理因素对实验结果的影响，从而使处理因素的！ 
效应得以体现。处理因素的效应大小，是通过与对照组对比所得到的差别显现。临床有很多疾 
病，如感冒、慢性气管炎、关节酸痛和早期高血压等疾病不经药物治疗，也会自愈或随着季节变 i 
化而缓解，因此必须设立对照组。医学研究中常用的对照组形式主要有以下几种，应该根据研 | 
究目的和研究条件等因素的不同，选择适当的对照形式。 

1. 空白对照空白对照 (Wank control) 指对照组不给予任何处理。该对照形式反映了研究, 
对象在实验过程中的自然变化。如研究某药物的抑瘤效果，将大白鼠染瘤后，实验组大白鼠的I 
饲料中投放该药物，对照组大白鼠的饲料中不投放。由于空白对照容易引起实验组和对照组受 1 
试对象的心理差异，从而影响实验效果的测定，因此，临床试验一般不宜使用空白对照。 

2. 安慰剂对照安慰剂对照 (placebo control) 指对照组使用一种不含药物有效成分的“伪I 
药物”，即安慰剂 （placeho)， 其外观、气味、剂型和处置上均与实验药物相同，不能为受试对象所I 
识别，常用于临床试验。使用安慰剂的目的在于克服研究者、受试者、参与疗效和安全性评价 | 
的工作人员由于心理因素所造成的偏倚，有助于防止对照组的病人产生与试验组的病人不同的 | 
心理，使用时要注意保密。设置安慰剂对照可以消除疾病自然进展的影响，并分离出由于试验I 
药物所引起的不良反应，是金标准的对照形式。需要注意的是，安慰剂中不含药物的有效成分， 
相当于未对患者釆取有效的治疗，可能存在医学伦理学问题，需持慎重态度。 

3 - 标准对照对照组采用现有标准方法或常规方法，或不专门设立对照组，而以标准 值或丨 
正常值作为对照，对此称为标准对照 (standard control )。例如，在新药临床试验中，对照组采用| 
目前疗效明确的某种药物(代表当时疗法的水平),试验组患者采用某种新药，目前疗效明确的I 
药物组就是标准对照组。 

4. 实验对照对照组不施加感兴趣的处理, fe 施加某些有关的实验因素。实验对照 (expe- | 
rimental control) 常用于有刺激、有损伤的动物实验，如假注射、假手术等，其目的是使两组动物 
所受到的刺激、损伤相同，以避免施加处理的方式可能对动物产生的影响。如研究某种注射剂 
的效果，实验组动物注射该制剂，而对照组动物注射无药理作用的生理盐水，使两组动物均接 ： 
受注射，接受的刺激与损伤保持一致。 

5. 自身对照自身对照 (self-control) 是指对照与实验在同一受试者身上进行，可以是同一 
受试者不同处理前后，也可以是不同身体位置。如选用双下肢烧伤程度相同的病人，一侧采用丨 




阳性药物，另一侧采用试验药物，从而避免个体差异引起的误差。 

6. 相互对照相互对照 (mutual control) 指各实验组之间互为对照。例如，比较几种不同药 
物或同一种药物不同剂量对某种疾病的疗效，目的是比较其疗效差别时，可以使用相互对照。 

7. 历史对照历史对照 (historical control) 不专门设立对照组，而是以过去的研究结果作为 
对照，如晚期肝癌以往的治愈率接近为0,若研发的某种新药，临床医生用该药治愈了几例该癌 
症患者，在此药物试验中，尽管未专门设立对照组，而潜在的无治愈的病例作为对照。一般情 
况除了难以治疗的疾病外 ，一 般不宜提倡该对照。因为历史资料与现存数据可能存在不可比的 
问题。 

需要注意的是，通常不宜仅设立一个处理组，并对该组受试对象用药前后的情况进行对比， 
即自身前后对照设计。特别是对有短期自愈倾向或周期性发作倾向的疾病，实验前后的某些因 
素可能发生变化，时间、环境等均可能很大程度上影响到实验结果，难以反映药物的真实效应。 
如果需要考察服药前后的变化，通常要同时设立一个平行对照组，观察其处理前后的变化情况， 
将两组接受干预前后变化的差值进行比较，以控制非处理因素的影响。 

二、随机化原则 

随机化 (randomization) 是指每个受试对象有相同的概率或机会被分配到不同的处理组。随 
机不等于随意，如评价 A、B 两种药物的疗效，设置两个诊室，让病人随意选择诊室，进人1号诊 
室的服用 A 药，进人2号诊室的服用 B 药，表面上好像病人进入哪个诊室是随机的，但是，在病 
人选择诊室的过程中已经掺杂了主观性，如从众心理，可能大家都会倾向于选择就诊人数多的 
诊室。因此，这样的分组不仅违背了随机化的原则，还可能导致两个组别之间病人在年龄、性 
别、病情等方面不具有可比性，导致试验结果出现偏倚。 

随机化分组可以使各处理组的受试对象具有相近的特征，可比性好；避免研究者的主观因 
素对分组结果的 影响； 另外，随机化是所有统计方法的理论基础，非随机样本进行比较时得到 
的推断结果其可信度往往值得怀疑。 

随机化分组主要通过随机数 (random number) 来实现。常用方法有两种，即由随机数字表 
(table of random number) 和由计算机程序产生随机数。各种统计软件如 SAS、SPSS 等，以及常用 
的办公软件如 Excel, 均可以产生随机数。当采用统计软件生成随机数时，可设置种子数使得所 
产生的随机数能够再次生成，即具有重现性，这是目前使用较多的产生随机数的方法。 

举例，见表 15-1 ，将20位受试者随机分配到两组中。左起第二列为随机数，由 SPSS 产生 
(取均匀分布的随机数,种子数为2013,可重 现); 第三列为对第二列随机数编秩，遇相同数可以 


表 15-1 随机分配20位受试者 
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顺序编；第四列为根据第三列的秩号分组，秩号1~10为第一组，秩号11~20为第二组。受试者 
可以根据人组顺序，依次进人对应的组别。如前三位受试者进人第二组，第四位至九位受试者 
进人第一组，第十位受试者进人第二组，依次类推, 20位受试者随机化入组完毕。 

目前采用的随机化方法包括简单随机化、区组随机化、分层随机化、分层区组随机化和动 
态随机化等，近年来还出现了中央随机化的新方式，这些方法可以在简单随机化基础上进行， 
此处不再赘述。 


: .、重复原则 


重复 （replication) 是指在相同实验条件下重复进行多次观察。重复是消除非处理因素影响 
的又一重要方法，表现为样本量的大小和重复次数的多少。由于各种影响因素的存在，不同研 
究对象对同一处理因素的反应不同，表现为其效应指标的数值不同，只有在大量重复实验的条 
件下，实验的效应才能反映其真正的客观规 律性； 反之,如果样本量不够，结果就不够稳定，得 
不到应有的结论。从统计学的角度讲,观察例数越多，根据样本计算的频率或平均数等统计量 
越接近总体参数。重复原则并非要求无限大的样本,样本量太大,工作量也大,增大人力物力 
的消耗，难于控制实验条件，影响研究的质量。样本量究竟需要多大,可以采用统计学方法进 
行计算，详见本章第四节。 

第三节临床试验设计及统计分析问题 


临床试验 (clinical trial) 从研究的性质划分，属于实验性研究的范畴。临床试验设计也必须 
遵循实验设计的基本原理，其设计的基本要素也包括研究对象、处理因素和实验效应，同时必 
须遵循对照、随机化和重复的基本原则。但由于其研究对象为人,还应该考虑受试者的知情同 
意、心理因素、伦理道德等问题，因此临床试验的设计与分析具有特殊性，目前国际上对撰写临 
床随机对照试验 （randomized controlled trial, RCT) 报告提供了参考标准（附录1 )。本节以新药临 
床试验为例，针对其特殊性，简要介绍临床试验的设计及统计分析方法,其他临床研究亦可参 
照进行。 

一. 临床试验的特点及注意事项 

1 . 临床试验的分期临床试验分 I ~1V 期，I期试验对象为少量志愿者，主要为耐受性试验 
和药代动力学试验。耐受性主要观察单次或多次给药的生命体征、实验室指标的异常变化和不 
良反应的发生;情况，确定临床给药的安全 范围； 药代动力学主要观察药物在体内的分布、吸收 
与代谢的情况。 n 期试验主要是探索适应症的类型、最适剂量以及研究价值。 m 期试验是确证 
性研究，证实试验药物的疗效和安全性。IV期试验则是上市后进行的试验。不同期别的临床试 
验所要求的样本含量和使用的统计学方法都有所不同。 

2. 主要指标的确定由于一个临床试验通常只有一个研究目的，因此，必须明确定义能够 
反映处理因素效应的主要观察指标，安全性也可以是主要指标。主要指标的选择应考虑相关领 
域已有的公认准则和标准，通常情况只选1~2个主要指标。主要指标是临床试验评价和样本含 
量估计的主要依据。 

3. 设立合理的对照因为研究对象是人，如何设立对照组必须慎重考虑，决不允许研究工 
作所设立的对照组对受试者的健康有所危害。在临床疗效的研究中，可以使用安慰剂对照，但 
要以保护受试者的根本利益为原则，有其严格的适用范围。如要评价一种新药对某型菌痢疗效 
如何，就不宜设立安慰剂对照。标准对照是临床试验通常采用的对照形式，即采用目前通用的 
?台疗方法或疗效较好的常规阳性药物作为对照。 
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4. 对照的实施为了避免研究者及受试者对不同组别产生的不同心理反应，通常需采用 
“盲法 (blind method)” 进行试验。盲法分双盲 (double blind) 和单盲 (single blind) 两种。 所谓双 
盲是指研究者和受试者在整个试验过程中都不知道受试者所接受的是何种处理(试验药或对照 
药); 单盲是指仅受试者处于盲态。盲法可以避免研究者和受试者对试验结果的人为干扰，是控 
制临床试验结果出现偏倚的重要措施。 

5. 意向性分析的原则意向性分析的原则 （intention to treat principle, ITT) 是指主要分析 
应包括所有随机化的受试者。 ITT 原则不管受试者随机化后是否违背方案、是否接受处理、是 
否有随机化后的观察结果、依从性好坏、是否完成治疗等，均纳人分析。根据意向性分析原则 
确定的数据集称为全分析集 (ftill analysis set, FAS), 基于全分析集的分析结果为主要分析结果。 
此外，还需确定符合方案集 (per protocol set, 简称 PPS), 即符合试验方案，依从性好且完成试验 
过程的受试者集合。实际中需同时对 FAS 和 PPS 进行分析，如果两个结果不一致，下结论时需 
作出解释。 

二、临床试验的设计类型 

常用的临床试验设计类型有平行组设计、交叉设计、析因设 计等。 

(一）平行 组设计 

平行组设计 (parallel groups design) 是最常用的临床试验设计类型，是指将受试者随机地分 
配到试验的各组，各组同时进行试验。平行组设计可设置一个或多个对照组，试验药也可设置 
多个剂量组。对照组可分为阳性或安慰剂对照，阳性对照一般选用针对所选适应症的当前公认 
的有效治疗药物，安慰剂的使用则必须符合医学伦理学要求。最简单的临床试验设计方法是设 
置一个试验组和一个对照组，称为双臂试验 (two-arm trial ) 0 有时设多个对照组，如设置一个安 
慰剂组和一个阳性对照组，称为三臂试验 (three-arm trial)。 设置多个试验组则常用来探索试验 
药物不同剂量的作用。 

例 15-1 为评价 批格列 酮治疗2型糖尿病的疗效和安全性，以磺酰脲类降糖药为阳性对 
照，进行多中心、随机、平行组设计临床试验，其设计格式如图 15-1 所示。 


图 15-1 平行组设计示意图 


平行组设计的主要 特点： 实施起来较为简单，可以将受试者不等比例地分配到各治疗组， 
但与其他设计类型相比，该设计通常需要更多的受试者。 

(二）交叉 iSi 十 

交叉设计 (cross-over design) 是一种特殊的自身对照设计，是将自身比较和组间比较综合应 
用的一种设计方法，即每个受试者随机地在两个或多个不同试验阶段分别接受指定的处理(试 
验药或对照药)。例如，在一项用于治疗偏头痛的新药临床试验中，将每个受试者随机分配到 
AB 或 BA 两个不同的试验顺序 组中； AB 顺序组的患者在第一阶段服用新药，在第二阶段服用 
安 慰剂； 而 BA 顺序组则相反,患者在第一阶段服用安慰剂，在第二阶段服用新药。 

例1 5-2 为评价两种降压药物 A 、 B 的作用，进行随机双盲交叉设计临床试验，其设计格式 
| 如图 15-2 所示。 

交叉设计的主要 优点： 由于同一受试者接受多种处理，可以明显节省样 本量； 另外，该方法 
\ 能够很好地控制个体间的差异和时间对处理因素的影响，试验效率比较高。主要 缺点： 同一个 
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图 15-2 交叉设计示意图 


受试者可能需要接受多种处理和经历多个洗脱期，从而使研究周期过长，如果受试者无法坚持 
到最后而退出试验，则造成数据 缺失； 另外,必须安排洗脱阶段，否则会直接影响对处理因素作 | 
用的正确评估。在临床上交叉设计多用于生物等效性研究、或者评价可以缓解症状但无根治作 | 
用药物的疗效，如治疗肿瘤化疗引起的呕吐、降血压等药物的疗效比较。 

(三）析因设计 

析因设计 (factorial design) 是一种多因素的不同水平进行的交叉分组试验设计,通过不同因 
素不同水平的组合，对两个或多个处理及其交互作用同时进行评价。例如，欲研究某中药复方 
治疗高胆固醇血症的效果，包括该中药复方中甲药和乙药对降低胆固醇的作用，以及甲药和乙 
药是否有交互作用。将高胆固醇患者完全随机地分配到四个处理组，用不同方法 治疗： 第一组 
用基础治疗 （ 既不用甲药，也不用乙药),第二组在基础疗法的基础上加用甲药，第三组在基础 
疗法的基础上加用乙药，第四组在基础疗法的基础上加用甲药和乙药，比较不同组别胆固醇降 
低量。这样不仅可推断处理因素 （ 甲药、乙药)是否影响试验结果(胆固醇的降低量),还可检验 
处理因素之间是否有交互作用。 

在析因设计中，通常用数字表达式表示不同因素和水平数的设计,如2 x 3 x 2析因设计表 
示有3个因素，第一个因素有2个水平,第二个因素有3个水平,第三个因素有2个水平。最简 
单的是 2x2 析因设计，即两因素两水平的析因设计。 

析因设计是多因素的交叉分组 k 验设计，其主要特点是可以在一个试验中安排多个处理因 
素，同时分析多个因素的主效应和交互作用，并能够通过比较寻求不同因素和水平的最佳组合。 
其缺点是在因素或水平数较多的情况下，需要的试验组数和样本含量都比较大，临床上不容易 
实现。 

三、 临床试验的比较类型 

一般统计检验的原假设是两组(或多组)总体参数相同，而备择假设为两组(或多组)总体参 
数间不同。在本书前面介绍的大部分内容都是这种检验，称为差异性检验。但临床试验中根据 
比较的目的不同、对照组的设置不同，比较的类型也有所不同，分为优效性 (superiority) 试验'等 
效性 (equivalence) 试验和非劣效性 (non-inferiority) 试验三种。 

(― ) 优效性试验 

检验一种药物是否优于安慰剂或另一种药物的试验，称为优效性试验。优效性试验的原 | 
假设为试验药总体疗效小于或等于对照药的总体疗效，而备择假设为试验药总体疗效比对照 
药好。拒绝了原假设即可得出试验药比对照药优效的结论。有时，试验药比对照药优于某一 
具有临床意义的数值时才是优效，这时优效性试验称为临床优效性试验，需要制定一个相应 
的界值，即试验药与对照药之间相差的临床上认可的最小值 A( 髙优指标）,对此只需要计算 
两组差值的置信区间，如果置信区间的下限 QSA, 则可以认为试验药物有效，如规定降压药 
物舒张压下降的 A = lOmmHg, 则两组差值的下限必须大于或等于 lOmmHg, 才能够判定该药 
物有效。 

(二）非劣效性试验 

检验一种药物是否不劣于另一种药物的试验，称为非劣效性 (mm-infcriority) 试验。其原 


笔记 
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假设为试验药总体疗效比对照药的总体疗效要差，且两药总体疗效之差大于或等于非劣效 
界值 A; 而备择假设为试验药总体疗效比对照药的总体疗效要好，或者试验药总体疗效虽然 
比对照药差，但两药总体疗效之差小于 A。 拒绝了原假设便可得出试验药比对照药非劣效的 
结论。 

1. 非劣效性界值的确定临床非劣效性试验的一个重要问题是非劣效界值的确定。非劣 
效性界值 A 是一个有临床意义的值，若 △ 选择过大，可能会接受疗效达不到要求的 药物； 若 A 
选择过小，则可能无法获得非劣效结果。统计学上， △ 的确定一般采用两步法，先估计出阳性 
对照（以安慰剂为对照）的绝对疗效 M， 再 根据从 确定出 A。A 是由主要研究者和统计学专 
家根据既往研究或循证医学证据共同确定的，最终由主要研究者确认。的确定采用综合分 
析法，其中最常用的是 meta 分析法(可参考有关书籍)，即计算出阳性对照与安慰剂效应之差 
的95%双侧置信区间下限。获得 M 后，非劣效界值取△=%,(建议取/=0.5)。/值越接近0， 
越不容易得出显著性结论。如果没有历史资料可供参考， △ 值可由研究者根据实际临床意义 
决定。 

2. 非劣效检验方法非劣效性检验可以通过假设检验方法进行统计推断，其原假设为札： 
C-T^A t H r . C-r<A ，其中 C 和 r 分别为标准对照组和试验组的效应值。更简单的方法是通 
过置信区间估计进行统计推断，即按照单侧1 _«可信度，计算标准对照组与试验组效应差值的 
置信区间，若置信区间的上限 C，A 则可下非劣效的结论。例如，某项研究得出的标准对照组 
与试验组两组有效率差值的单侧97.5%的置信区间为 (_ ~， 0.12), 而预先规定的非劣效界值 
A=0.10, C V >A, 按照«=0.025的检验水准,不能得出试验组非劣于对照组的结论。 

(三）等效性试验 

对于等效性检验，只需要在两个方向上同时进行两次单侧检验，如果两个原假设均被拒绝， 
即前者推论试验组不比标准对照组差，后者推论试验组不比标准对照组好，则可以推断两组具 
有等效性。具体可以按照1 的可信度，计算两组差值的双侧置信区间，若置信区间的上下限 
(Q, Cd 完全在 (-△,△) 范围内，则可以下等效性的结论。 

第四节样本含量估算 

为了保证研究结论具有一定可靠性，常需要在设计阶段估算所需要的最少实验单位数，即 
样本含量(紐1^1 6 size)。 样本含量过小，假设检验效能不够，无法显现不同处理组间的 差别； 同 
时样本含量也不是越大越好,样本量过大会增加研究的费用和实际工作的困难，浪费人力、物 
力和时间，并且可能影响数据的质量。 

一、影响样本量的条件 

一般来说,统计学上样本含量估算取决于四个 要素： 

1. 假设检验的I类错误概率《的大小，I类错误概率 a 越小，所需样本含量越大。 

2. 假设检验的 n 类错误概率及或检验效能 1- 於的大小。一般要求检验效能最好在 0.80 及 
以上， n 类错误概率 p 越小,所需样本含量越大。 

3. 总体间差值>5的大小。如两总体均数的差值和或两总体率的差值3 = 1*,-)^。 
S 值越小，所需样本含量越大。若研究者无法获得3的信息，可通过査阅文献或预实验来估计。 

4. 总体变异性的大小。均数比较时需了解个体变异大小，即总体标准差 a; 率的比较需要 
了解总体率 a 的大小。 a 越大或 z 越接近50%,所需样本量越大。这些参数一般未知，可通过査 
阅文献或预实验来估计。 
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除上述四个要素外，还需要 注意： 对于设置安慰剂对照的优效性研究，选取的临床有效性I 
界值 △ 越大，所需要的样本含量 越大； 对于非劣效性和等效性研究，选取的允许差别的界值 △ 
越小，所需样本含量越大。 

:、常用的样本含量估算方法 

样本含量的估算方法有多种，其公式往往是根据检验统计量的公式,并考虑检验效能的大I 
小，反推而来。原则上，不同的检验方法都有确定的样本含量估算方法。下面介绍假设检验中 
常用的几种方法。 

1- 样本均数与总体均数比较(或配对比较)的样本含 S 



式中，》为所需要的样本含量，配对设计时 w 为对子数 M 为总体 差值; a 为总体标准差(配对设 
计为〜 ); 为标准正态分布的双侧临 界值； 单侧检验时，可改为单侧临界值 z a; 々为标准正态 
分布的单侧临界值。 

例1 5-3 研究维生素 E 缺乏时对肝中维生素 A 含量的影响，将大白鼠配对后分为两组，分 
别喂以正常饲料和维生素 E 缺乏饲料。已知其标准差为 550IU/g, 若肝中维生素含量 A 差异为 
700IU/g 在专业上认为有意义，取《 = 0.05 , /?= 0.05 ， 需要多大样本量？ 

本例 ct =550, <5=700, z 0 .os/2= 1.96, z 0X)S =lM 



即需要16只大白鼠配成8对。 

2. 两组样本均数比较的样本含量 

^+^ 1 ) (15-2) 

式中含义同上。01与02为样本比例，即01=«1/«，0 2 = «2/«，《 = 叫+«2。若则 
G = 02=0.5。 

例 15-4 欲比较 A、B 两种药物对四氧嘧啶糖尿病模型小鼠的降血糖作用。假设两药使得 i 
空腹血糖下降值相差 2.76mm 0 l/L 及以上有专业意义，若 FlJOmmol/Lj 取双侧 0.05, 检验效 | 
能为 0.90, 每组例数相等，问每组需要多少只小鼠？若 B 组的样本量是 A 组的两倍，则每组又 1 
各需要多少只小鼠？ 

本例 a = 1.70, <5 = 2.76^0.05^2=1.96,20.10= 1.282; 若两组样本含量相等，则 0,= 込 = 0.5, 可 

算得 

〜=« 2 =16/2 = 8,即每组需要8只小鼠。 

若 B 组的样本量是 A 组的两倍，即0, = 1/3,0 2 = 卜以 =2/3，则 

故 A 组需 = 1/3 x 18 = 6 只； B 组需叱 =0 2 ”=2/3x 18=12只。 


邏 
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可以证明，如果其他条件相同，当两组样本含量相同时，所需要的样本含量最少。 
3. 两样本率检验的样本含量 


r z a/2 yjjc e (.\- ic^CQi 1 + 02 1 ) +z fi >/^G- ?r ») / 6i + 冗 2 (1 —疋 2 )/g 2 j 


(15-3) 


式中心为两总体合计概率,心=0而 +0 2 7T 2 , 其中; T, 和 7T 2 为两组总体率， G 与込为样本比例，即 
0,=«,/«, 0 2 = /1 2 /«，《 = «1 + «2,2«/2和今符号意义 同前。 

例 15-5 欲比较甲、乙两种药物治疗心肌梗死溶栓的效果，预试验甲组溶栓的有效率为94%, 
乙组溶栓的有效率为85%。若取双侧 a=0.05, 单侧， 0.10,甲药组的样本含量占60%,乙药组 
占40%,试问比较两组有效率是否有差别各需要多少例样本？ 

本例? r, = 0.94 ,^ 2 = 0.85,0, = 0.60 ’ 0 2 = 0.40 , z 0 . 0S n = 1.96,z / ,=z 0 ., 0 = 1 -282 ，= 0.60 x 0.94 + 
0.40x0.85 = 0.904 
代入式 (15-3) 得 


I z all ylic c g-7r c XQ； l + Q2)+z fi >,(1 -〜)/g + 疋 2(1 — S)/g 2 


「 l^Jo.ma-O.^XQ.eO-' + olo 11 *) 4-1.282^0.94(1-0.94)/0.60+0.85(1-0.85)/0.40 


故甲药组需 «, = 0 1 «=O.6Ox495 =297 例患者，乙药组需要 n 2 =Q 2 n=0A0x 495=198例患者。 


练习题 

一、单项选择题 

1. 实验性研究随机化分组的目的是 （） 

A. 减少抽样误差 B. 减少实验例数 

C. 提高检验效能 D. 提高检验准确度 

E. 保持各组的非处理因素均衡一致 

2. 关于实验指标的准确度和精密度，正确的说法是（ ） 

A. 精密度较准确度更重要 B . 准确度较精密度更重要 

C. 精密度主要受随机误差的影响 D . 准确度主要受随机误差的影响 

E. 精密度包含准确度 

3. 在临床试验设计选择对照时，最高效的对照形式是（ 


A. 历史对照 
C. 标准对照 
E. 自身对照 

•• 实验设计的三大原则是（ 
A. 随机、对照、盲法 
C. 随机、对照、均衡 
E. 随机、对照、重复 


B. 空白对照 
D. 安慰剂对照 


B. 随机、均衡、重复 
D. 对照、重复、样本大小 



5. 某医师研究某新药治疗缺血性脑卒中恢复期的临床疗效，对照组采用阳性药物溶栓胶 
囊，这属于（ ） 

A. 空白对照 B. 历史对照 

C. 标准对照 D. 安慰剂对照 

E. 实验对照 

6. 估计样本量时，在其他条件不变时，设定的 n 类错误概率愈小，则 （） 

A. 所需的样本量愈小 B. 所需的样本量愈大 

C. 不影响样本量大小 D. 样本量的估计愈准确 

E. 样本量的估计愈不准确 

7. 阳性药为对照的临床非劣效性试验中，原假 设私是 （） 

A. C-T^A B. C-T>A 

C. C-T^-A D. T-C>A 

E. T-C^A 

8. 下列关于随机化的叙述，不正确的是 （） 

A. 随机化可以避免结果出现偏倚 

B. 随机化是统计推断的前提 

C. 随机化可以使各组非处理因素的分布尽量保持均衡一致 

D. 随机化可以防止研究者人为影响研究结果 

E. 随机化可以减少随机误差 

9. 临床试验采用双盲法的重要意义是 （） 

A. 便于试验实施 B. 减少患者在试验中脱落 

C. 防止出现过大的随机误差 D. 减少混杂因素的影响 

E. 减少试验中的偏倚 

10. 临床试验需要在设计阶段确定主要指标的目的是 （） 

A. 便于试验实施 B. 减少测量的随机误差 

C. 减少非处理因素的影响 D. 避免结果的任意性 

E. 更好地提高检验效能 
二、计算与分析 

1- 欲比较甲、乙两种药物治疗心肌梗死溶栓的效果，预试验甲组溶栓的有效率为 
95 %，乙组溶栓的有效率为 85 %。若取双侧 ot = 0.05,々=0.10, 两组病例数相同的情况下， 
临床试验每组最少需观察多少病例？ 

2. 为研究双歧杆菌辅助治疗新生儿高胆红素血症的疗效，对试验组和对照组经皮 
测胆红素下降值进行比较。假定两组标准差相等，(7 = 4.5^014,并假设专业上认为胆 
红素下降值相差 2.5jimol/L 有意义，若试验组与对照组样本含量的比例为2:1，现规定 
« = 0.05,々= 0.10,做双侧检验对照组需要多少病例才能发现差异？ 

3- 为探讨天然牛磺酸对高铅动物模型铅含量的影响，将实验大白鼠模型随机分到牛 
磺酸组和不使用药物的对照组。预实验 结果： 给药24小时后，测得两组动物血铅含量均 
值分别为 2 .4 () ng/L 和 3.45ng/L, 两组合并标准差为0.60吨几。若取《= 0.05 ，#=(). 10,要得 
到两组血铅含量不同的结论（双侧检验),试估计每组需要多少只实验大白鼠模型？ 

4. 为确定一种降脂药物的起始用药剂量，将30例新诊断的高血脂患者按就诊的先后 
顺序依次分入低、中、高三个剂量组，经一段时间治疗后，通过比较三组患者的治疗后低密 






度脂蛋白变化值来选择该降脂药的剂量。请根据以上描述 回答： 

( 1 ) 在这项研究中，研究的三要素分别是什么？ 

(2) 请从实验设计角度对此项研究进行评价，并对此研究设计提出改进意见- 
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随机临床试验 CONSORT 2010对照检查清单 
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招募受试者 14a 

14b 

基线 资料/ 15 

纳人分析的例数 16 

结局和估计值 17a 

17b 


对照检查的条目 


文题能识别是随机临床试验 

■細要，包方法、结果、结论几^ K 具体的指导建议参见 “CONSORT 
for abstracts”） 


科学背景和对试验理由的解释 
具体目的和假设 


描述试验设计 ( 诸如平行设计、析因设计)，包括受试者分配人各组的比例 
试验开始后对试验方法所作的重要改变 ( 如合格受试者的挑选标准),并说明原因 
受试者合格标准 
资料收集的场所和地点 

详细描述各组干预措施的细节以使他人能够重复，包括它们实际上是在何时、如何 
实施的 

完整而确切地说明预先设定的主要和次要结局指标，包括它们是在何时、如何测评的 
试验开始后对结局指标是否有任何更改，并说明原因 
如何确定样本量 

必要时，解释中期分析和试验中止原则 
产生随机分配序列的方法 

随机方法的类型，任何限定的细节(如怎样分区组和各区组样本多少） 

用于执行随机分配序列的机制(例如按序编码的封藏法)，描述干预措施分配之前为 
隐藏序列号所采取的步骤 

谁产生随机分配序列，谁招募受试者，谁给受试者分配干预措施 

如果实施了盲法，分配干预措施之后对谁设盲(例如受试者、医护提供者、结局评估 

者)，以及盲法是如何实施的 

如有必要，描述干预措施的相似之处 

用于比较各组主要和次要结局指标的统计学方法 

附加分析的方法，诸如亚组分析和校正分析 

随机分配到各组的受试者例数，接受已分配治疗的例数，以及纳人主要结局分析的例数 
随机分组后，各组脱落和被剔除的例数，并说明原因 
招募期和随访时间的长短，并说明具体日期 
为什么试验中断或停止 

用一张表格列出每一组受试者的基线数据，包括人口学资料和临床特征 
各组纳人每一种分析的受试者数目(分母)，以及是否按最初的分组分析 
各组每一项主要和次要结局指标的结果，效应估计值及其精确性(如95%可信区间） 
瘦，迮 i 义问时提供相对效位位和绝社效应 








附录 1 CONSORT statement-RCT 研究报告的信息（ 2010) 


论文章节/主题条目号 • _ 对照检查的条目 _ 

辅助分析 18 所做的其他分析的结果，包括亚组分析和校正分析，指出哪些是预先设定的分析，哪 

些是新尝试的分析 

危害 19 各组出现的所有严重危害或意外效果(具体的指导建议参见 “CONSORT for harms”） 

讨论 

局限性 

可推广性 
解释 

其他信息 

试验注册 23 临床试验注册号和注册机构名称 

试验方案 24 如果有的话，在哪里可以获取完整的试验方案 

资助 _ 25 资助和其他支持(如提供药品)的来源，提供资助者所起的作用 _ 

注： 我们极力推荐结合 “CONSORT 2010说明与详述”阅读本声明，那份文件对全部条目作了详细阐述。我们还推荐必要时阅读关 
于群组随机试验、非劣效性和等效性试验、非药物治疗、草药干预以及实效性试验的各种 CONSORT 扩展版。与本淸单有关的各种扩展 
版及最新参考资料，请见 www.consort-statement.org。 


20 试验的局限性，报告潜在偏倚和不精确的原因，以及出现多种分析结果的原因（如果 
有这种情况的话） 

21 试验结果被推广的可能性(外部可靠性，实用性） 

22 与结果相对应的解释，权衡试验结果的利弊，并且考虑其他相关证据 
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1. 概述 

SPSSC statistical package for the social sci 咖 es) 为“社会科学统计软件包”，由美国斯坦福大学的三位研究 
生于20世纪60年代末研制，目前已成为非专业统计人员的首选统计软件。 SPSS 最突出的特点就是操作界 
面友好，输出结果美观。 SPSS 使用 Windows 的窗口方式展示各种功能，使用对话框展示功能选择项，对于使 
用 Windows 的用户，只要了解统计分析方法，就可以方便地使用该软件为特定的科研工作服务。 SPSS 在全 
球的用户分布于通信、医疗、银行、证券、保险、制造、商业、科研教育等多个领域和行业,是世界上应用最广 
泛的专业统计软件之一。本书采用 SPSS17.0。 

SPSS 的基本界面和常用功能简介 如下： 

(1) SPSS 的基本 界面： 对于非统计专业的使用者, SPSS 的基本界面包括两个常用 窗口： 数据编辑窗口 
(DataEdkor) 和结果输出窗口 （Viewer)。 分别如附图1、附图2所示。 



附图1数据编辑窗口 


数据编辑窗口主要用于研究数据的录人、编辑和显示，以及数据集中相关变量名、变量标签、变量属性 
的定义和修改。数据编辑窗口由数据视图 (Data View) 和变量视图 (Variable View) 两个窗口组成，两者之间 
可以互相切换。数据文件的创建与保存详见 2.1 节。 

结果输出窗口会在分析后自动打开，显示程序运行后的所有结果。多个数据文件的分析结果将显示在 
同一个结果输出窗口中。双击某部分的结果可以对其显示的样式进行编辑。结果文件可以保存，其扩展名 






(2) SPSS 的常用统计分析 功能： SPSS 提供了所有常用的、较为成熟的统计描述与统计分析过程，: 
i+ 方法都在 Analyze 菜单中列出，可以满足非统计专业研究的基本统计分析需要。如附图3所示。 
it 分析过程将在本章第2部分进行详细介绍。 















2. 统计功能的实现 

2.1 数据文忭的建立 

建立数据文件是采用 SPSS 开始工作的第一步，主要是指把医学科研工作过程中采集的研究数据 (Data) 
按照 SPSS 软件的格式要求存入到计算机的磁盘中，以便调用、修改、分析。 SPSS 采用类似 Excel 表格的方式 
输入与管理数据，也可以直接导人 Exc e l、Text、dBASE、SAS、St a t a 等数据集。在 SPSS 中创建新的数据集时， 
通过 “File” — “New” — “Data” 打开数据编辑窗口后创建。 SPSS 数据集的扩展名为 “.sav”。 

为了建立和使用数据集时方便，建议用户创建新数据集时，分两步 进行： 

( 1 ) 定义数据集的 框架： 即先进行数据集中涉及的所有变量的定义，包括变量名、变量标签、变量属性等。 
变量的定义在数据编辑窗口 （ Data Editor) 的变量视图 (Variable View) 中完成。如附图4所示。 



附图4变量视图 

在变量视图中，双击第一行的空白单元格，即可定义变量名 (Name)、 类型 (Type)、 宽度 (Width)、 小数点 
位数 (Decimals), 变量标签 (Label )、变量值标签 (Values ) 等。 

其中，变量名就是所研究的指标在软件中可被识别的名称，通常由用户自己定义。定义时需遵守 SPSS 
软件的变量名命名规则，否则将无法被识别或者报错。 SPSS 中变量名的命名规则 为：① 最长为64个字 
节； ②以字母或汉字开头，不 能以？ 或结尾，其中不能有空格、通配符或某些特殊字符，如？、 * 丄，等； 
③变量名须唯一，不区分大 小写; ④变量名不能与 SPSS 的系统关键词相同，不能使用逻辑关系运算符 all 、 
AND、OR 等，如果输人了系统关键词，则系统会提示错误。下面，我们以“性别”(变 量名： gender) 这一常见 
的名义变量为例，简述新变量的定义过程。 

如附图5所示，录人了 “gender” 这一变量名后，后面的各个属性会出现默认值，用户可根据变量的具 
体性质进行修改，变量标签除外。单击要修改的单元格后，有的单元格后会出现表明系统提供了备 





选项，如在变量类型中单击后，就会弹出对话框，显示 SPSS 软件所提供的8种变量 类型： 标准数值型 
(Numeric)、 逗号数值型 （Comma)、 加点数值型 （Dot)、 科学记数 (Scientific notation), 日期型 （Date)、 自定义 
(Custom currency)、 字符型 (String)。 最常用的是标准数值型、日期型、字符型三种，为了分析方便，大多数医 
学研究的变量都会被定义成标准数值型。 


画 aLJ 



附图5在变量视图中定义新变量 


变量标签 (Label) 是对所对应的变量的说明，可以为中文，如本例中，我们将变量名设置为 “gender” ，此 
时，可将变量标签设置为“性别”，以便使用数据集的用户能清楚地了解变量的具体含义。一些分类资料的 
具体赋值情况则可通过变量值标签 (Values) 进行进一步的定义，变量值标签也就是对变量赋值的说明。 

附图6所示即为对变量值标签进行定义的窗口。例如 gender 这一变量，赋值1代表男性，2代表女性， 
定义变量值标签时，可以单击变量值标签单元格中的在弹出的对话框中（附图6)，取值 (Value) 处键人 
“1”，标签 (Label) 处键入“男性”，单击添加 (Add) 后，显示“1 =男性”，即完成了一条变量值标签的定义，同样 
的操作可定义 “2=女性”。变量值标签的定义可以帮助使用者对数据集有更好地了解，也为日后使用数据集 
提供了方便。 
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M 

定义好一个变量的信息后，双击其下面的一行即可进行新变量的定义。如附图7所示，定义了性别 
(gender). 年龄 （ age )、 身高 (height)、 体重 (weight)、 病情 (status) 等5个变量。其中，病情的变量值标签定义为 
不同的严重 程度： 1=轻，2=中，3 =重。 



附图7变量视图中定义好的5个变量 

(2) 数据 录入： 变量名及其属性定义好之后，就可以切换到数据视图 (Data View) 中进行数据录人了。此 
时，各列的列名已经变成了刚才定义好的变量名。所采集的数据按照一个观测对象一行的顺序录入。如， 
采集了 20名患者的基本资料，录入好的数据集将如附图8所示。 



附图8 20名患者的基本资料 

(3) 数据集的 保存： 建立好新的数据集之后，可以点击 “File”— “Save” 在弹出的对话框中选择要保存文 
件的路径，在 “File name” 后面键人数据集的名称，点击 “Save” 即可。如附图9所示。本例，数据集的名称为 
“患者基本情况 .sav” ，保存在“桌面”上。 
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附图9数据集的保存对话框 


2.2 统计特征计算 

变量统计特征的计算是收集好资料进行统计分析的第一步。下面，以例 2-6 为例，介绍描述计量资料集 
中趋势和离散趋势的统计指标。 

例 2-6 的数据录入如附图10所示，每列表示一位患者，一行表示该患者一天的收 缩压： 



附图10两名患者测得的5天收缩压 

统计描述指标的输出可通过 “Analyze”-》■ “Descriptive Statistics”一►“Explore...” 实现。弹出的对话框如附 
图11所示。 

选择要进行统计描述的变量，单击按钮“吟”，将变量选入到 "Dependent List” 列表框，点击 “Statistics” ， 
在弹出的对话框中选择 “Descriptive， 和 “Percentiles”， 即可得到计量资料常用的统计描述指标。如附图12 
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2.3 画统计图 

对于绘制常用的统计图，较为简便的方法可通过 “Graphs” — “Legacy Dialogs” 中选择不同类型的图实现。 
以下结合第五章的例子分别进行说明。 

2.3.1 直方图 

根据某市某年150名3岁女孩身高频数表(见表 5-11) 绘制成频数分布图。数据录人如附图13所示。 



附图13表 5-11 对应的数据集 


由于 SPSS 软件是针对原始资料输出直方图的，因此对于表 5-1 1的频数表资料，可先根据“频数”对“身 
高”数据进行加权。通过 “Data”- > “Weight Cases...” 实现。如附图14所示，点击 “Weight cases by” ，将“频数” 
选人 "Frequency Variable" 列表框中，点击 “Ok”。 

直方图的输出可通过 “Graphs” —》• “Legacy Dialogs'—► “Histogram...” 实现。弹出的对话框如附图 15 所示。 



卜 [ 1； 











选择观测变量“身高”，单击按钮“今’，选人到 “Variable” 列表框，点击 “Ok” ，即可得到原始的直方图。 
选中该直方图后，双击即可进人编辑状态。需要对图的某个部分进行自定义时，只需选中该部分后双击即 
可进行定义。 例如： 要对横坐标的刻度进行修改，可选中横坐标，双击后，在弹出的 “Properties” 对话框中选 
择 “Scale” 标签页实现。 

编辑后输出的直方图如附图16所示。 



附图16某市某年150名3岁女孩身高频数分布 


当需绘制表 5-12 所对应的分群金字塔图 （population pyramid) 时，数据录人如附图口所示。其中， 
“HbAlc” 为各个组段的下限，丫为各组段的频数，“组别”区别不同的患者类型。 
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附图17表 5-12 对应的数据集 


同一般的直方图绘制一样，绘制分群金字塔图时,需要先对数据加权，加权的方法同附图I 4 ,本例权重 
变量为“广。 

分群金字塔图的输出可通过 “Graphs”-♦ “Legacy Dialogs'* —*■ “Population Pyramid...” 实现。在弹出的对话 
框中选择 “Compute counts from data” ，选中 “HbAlc” ，单击按钮“呤”，选人到 “Show Distribution over : 框，选 
中“组别”，单击按钮“今”，选人到 “Split by:” 框中。如附阁18所示。 

点击 “OK” 可得到原始的分群金字塔图，双击图形后可进行编辑，选中并双击需修改的部分后，输出的 
分群金字塔图如附图19所示。 







2.3.2 线图 

根据某地1968—19"74年男女结核病死亡率 (1/10 万)资料(见表 5-13) 绘制普通线图。数据录人如附图 
20所示。其中，“性别”为分组变量，“死亡率”为观测指标，“年份”为观察的时间。 

线图的输出可通过 “Graphs”- "Legacy Dialogs"- “Line...” 实现。由于要比较男性、女性的死亡率需 
绘制复式线图，因此，首先在弹出的对话框中选择 “Multiple”， 点击 “Define”。 再选择 “Other statistic(e.g. 
mean)", 把指标变量“结核病死亡率”选人 "Variable" 框中，把时间变量“年份”选人 “Category Axis” 框，把分 
组变量“性别”选人 “Define lines by” 框。如附图21所示。 

点击 “0K” 可得到原始的普通线图，按需要双击线图，选中并双击需修改的部分后，输出的线图如附图 
22所示。 




附图 21 Define Multiple Line 对话框 


附图 22 某地 1968 — 1974 年结核病死亡率 U/10 万） 


需绘制半对数线图时，只需先绘制普通线图，输出后。选中输出的普通线图双击进人编辑状态，单击选 
中纵轴，再双击后进行编辑，在弹出的属性选项卡中把纵轴的尺度改为以10为底的对数尺度即可得到。具 
体操作此处不再赘述。 










2.3.3 箱式图 

根据大白鼠正常肝和肝肿瘤中递甲氨酶 (CPM) 的活度(见表 5-15) 绘制箱式图。数据录人如附图23所 
示 P 其中，“递甲氨酶活度”为观测指标，“组别”为分组 变量： 1 =正常肝，2 =肿瘤肝。 












附图23表 5-15 对应的数据集 


箱式图的绘制可通过 “Graphs“Legacy Dialogs”—“Boxplot...” 实现。在弹出的 “Boxplot” 对话框中选 
择 “Simple” 和 ‘Summaries for groups of cases”， 点击 “Define”。 在弹出的 “Define Simple Boxplot” 对话框中把“递 
甲氨酶活度”选人 “Variable” 框中、把“组别”选入 “Category Axis” 框中。如附图24所示。 

点击 “0K” 可得箱式图。如附图25所示，图中箱体两端的直线上下两端分别表示去除离群点后的最大 
值和最小值。箱体直线上方岀现的带数字的圆点，表示离群值的观察单位的编号，本例，第20例大白鼠取 
值较大，该例属于肿瘤肝组，通过原始数据可查得其递甲氨酶活度为 814(CPM) 0 由附图25可见，大白鼠肿 
瘤肝中递甲氨酶的活度明显高于正常肝中递甲氨酶的活度，而且数据的变异性很大。 
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附图24 Define Simple Boxplot 对话框 
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附图 25 大白鼠正常肝与肿瘤肝中递 
甲氨酶的活度 (CPM) 


2.3.4 误差条图 

根据试验组和对照组6周后血压的变化情况(见表 5-16) 的数据进行介绍。数据录人如附图26所示。 
其中，“组别”为分组变量，赋值为试验组、对 照组； “血压变化值”表示观测指标，“血压”赋值为舒张压、收 
缩压。 







附录 2 SPSS 统计软件上机实习 
Mg、iJsg? M 4] ~ ^ \n ^ ^ ' X I 


附图26表 5-16 对应的数据集 

第五章图 5-7 所对应的误差条图的绘制可通过 “Graphs” —“Legacy Dialogs” — “Bar...” 实现。在弹出 
的 “Bar Charts” 对话框中选择 “Clustered” 和 “Summaries for groups of cases” ，点击 “Define”。 在弹出的 “Define 
Clustered Bar” 对话框中，点击 “Other statistic(e.g. mean)”， 将“血压变化值”选人 “Variable” 框中，第一个分 
层变量“血压”选人 "Category Axis” 框中，第二个分层变量“组别”选人 “Define Clusters by" 框中。如附图27 


点击 “Options...” ，在弹出的对话框中，选择 “Display error bars” ，并在 “Error Bars Represent” 下方的框中， 
选择 “Standard error” ，以使输出的误差线代表标准误的大小，可在 “Multiplier: ”后的框中键入需输出几倍标 
准误，本例定义为“1.0”。点击 “Continue”， 最后点击 “0K” 可得误差条图。如附图28所示。 




2.3.5 散点图 

根据高血脂患者载脂蛋内 B 与低密度脂蛋白的关系(见表 5-17) 绘制散点图。数据录入如附图29所示 c 









附图 29 表 5-1 7对应的数据集 


散点图的绘制可通过 “Graphs” — “Legacy Dialogs” — “Scatter/Dot” 实现。在弹出的 “Scatter/Dot” 对话框中 
选择 “Simple scatter” ，点击 “Define”。 在 “Simple Scatterplot” 对话框中，把指标 “LDL” 选入 “Y Axis” 框、把指 
标 “A P o_B” 选人 “XAxis” 框。如附图30所示。 

点击 “0K” 得到原始的散点图，按需要进行编辑即可得附图31。 



2.3.6 直条图 

单式条图的绘制较为简单,这里结合复式条图进行介绍，单式条图的操作可参考进行。 

根据某地区1952年与1972年三种疾病的死亡率 (1/10 万 )( 见表 5-19) 绘制复式条图。数据录人如附图 
32所示。 

复式条图的绘制可通过 “Graphs” —“Legacy Dialogs”— “Bai •…” 实现。 在弹出的 “Bar Charts” 对话框中选 
择 “Clustered” (如绘制单式条图则选择 “Simple”） 和 “Summaries for groups of cases” ，点击 “Define”。 在弹出的 
“Define Clustered Bar” 对话框中，点击 “Other statistic(e.g. mean)” ，将“死亡率”选人 “Variable” 框中，第一个分 
层变量“死因”选人 "Category Axis” 框，第二个分层变量“年份”选入 “Define Clusters by" 框中。操作过程与界 
面同本章的节 2.3.4, 只是本例中无需通过 “Options...” 定义误差线。 








单击 “OK” 得到原始的复式条图。双击后可进行编辑，得到附图33。 



附图33某地1952年与1972年三种疾病死亡率比较 
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2.3.7 圆图 

根据复方猪胆囊治疗老年性气管炎近期疗效资料(见表 5-20) 绘制单纯型近期疗效的圆图。数据录人如 
附图34所示。 
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圆图的绘制可通过 “Graphs”— “Legacy Dialogs”“Pie...” 实现。在弹出的 “Pie Charts” 对话框中选择 
“Summaries for groups of cases” ，点击 “Define”。 在弹出的 “Define Pie” 对话框中，单击 “Sum of variable” ，把“构 
成比”选入 “Variable” 框，分组变量“疗效”选人 “Define Slices by” 框。 如附图 35所示。 

点击 “OK” 得到原始的圆图。可根据需要进行修改得到附图36。 



附图35 Define Pie 对话框 附图36复方猪胆囊治疗单纯型老年气管炎近期疗效 

23.8 百分比条图 

根据复方猪胆囊治疗老年性气管炎近期疗效资料(见表 5-20) 绘制百分比条图。数据录入如附图37 所示。 
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附图37表 5-20 对应的数据集 


百分比条图的绘制可通过 “Graphs” —“Legacy Dialogs”->“Bar...” 实现。在弹出的 “Bar Ch arts ”S 话框中 
选择 “Stacked” 和 “Summaries for groups of cases”， 点击 “Define”。 在弹出的 “Define Stacked Bar” 对话框中，选 
择 “Other statistic(e.g. mean)” ，将“构成比”选人 “Variable” 框中，把分组变量“疾病类型”选人 “Category Axis” 
框，把“疗效”选人 “Define Stacks by” 框。如附图38 所示。 
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附图38 Define Stacked Bar 对话框 

点击 “OK” ，选中输出的百分比条图，双击进人编辑状态，点击右上角的工具按钮“画 (Transpose chart 
coordinate system)”， 可得到原始的百分比条图，再根据需要进行修改得到附图39。 



构成比(%) 

附图39复方猪胆囊治疗老年性气管炎近期疗效比较 

2.4 /检验 

2.4.1 配对 f 检验 

根据例 7-2 的资料介绍配对/检验。 

研究男性志愿者饮用咖啡前后运动状态下的心肌血流量，数据录人如附图40所示。其中，每个对子观 
测到的数据放在同一行。本例，每个志愿者饮用咖啡前后的心肌血流量观测值放在同一行，共12行。 
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附图40例 7-2 对应的数据集 


配对/ 检验可通过 “Analysis” —>■ “Compare Means” — “Paired-Samples T Test...” 实现。在弹出的对话框 
左侧的变量列表中单击选择成对分析的变量“饮用前”和“饮用后”，单击按钮“命”，将变量选入到 “Paired 
VariableCsr 变量列表中。如附图41所示。 



ai 



附图41 Paired-Samples T Test 对话框 


如需输出饮用前后差值的总体均数的95%可信区间，可以在附图41所示的对话框中，单击 “Options. 
设置 "Confidence Interval” 为95%,点击 “Continue” 。最后单击 “0K” 完成。输岀的主要结果 如下： 



准误 (Std. Error Mean)、 差值总体均数的95% 可信区间(95% Confidence Interval of the Difference), 以及 / 值 (t)、 
自由度 (df )、 双侧尸值 (Sig. 2-tailed )。 本例: / =3.740, 尸 =0.003 , 可以认为饮用咖啡前后运动者的心肌血流量 
存在差异。 

2.4.2 两组独立样本的 f 检验 

根据例 7-3 的资料介绍两组独立样本的 f 检验。 








研究低氧环境和正常含氧环境中运动者的心肌血流量，数据录入如附图 42 所示。其中，分组变量为一 
列，本例为“分组 ”（ 1 =正常组，2=低氧 组); 观测指标“心肌流量”为一列。 



附图42例 7-3 对应的数据集 


两组独立样本的 f 检验可通过： “Analyze”“Compare Means” — “Independent-Samples T Test...” 实现。 
在弹岀的对话框左侧的变量列表中单击选择观测指标“心肌流量”，单击按钮“命”，将变量选入到 “Test 
VariableCsT 列表中。选中分组变量“分组”,单击按钮“呤”，将变量选入到 “Grouping Variable” 框中。单击 
“Define Groups …”， 在弹出的对话框中，录人两组的赋值“1”和 “2”。如附图43所示。 






附图43 Independent-Samples T Test 对话框 


如需输出两均数差的95%可信区间，可以单击 “Options...” ，设置 “Confidence Interval” 为95%,点击 
“Continue”。 最后单击 “OK” 完成。输出的主要结果 如下： 



for Equality of 

t-test for Equality of Means 

95% Confidence 

F 

Sig. 

t 

df 

Sig. 

(2-tailed) 

Difference 

Std. Error 

Difference 

Lower 

Upper 

Equal v^ce Sa T med d 

1027 

.327 

-7.579 

-7.332 

15 

.000 

.000 

:= 

.3291 

.3402 

-3.1960 

-3.2460 

-1.7929 

-1.7429 








结果整体上分为两部分，方差齐性检验的结果 “Levene’s Test for Equality of Variances" 和两组独立样 
本，检验的结果 "t-test for Equality of Means”。 其中， / 检验的结果包括了方差齐性假定满足 “Equal variances 
assumed” 和不满足 “Equal variances not assumed” 两种情况的检验结果，从左到右依次给 出了/ 值(《)、自由度 
(df)、 双侧 尸值 (Sig. 2-tailed), 均数差 （Mean Difference)、 均数差的标准误 (Std. Error Difference)、 两均数差的 
95% 可信区间 ( 95% Confidence Interval of the Difference )。 

在看结果时，首先要看方差齐性检验的结果，即两样本所来自的总体是否方差相等。本例厂=1.027, 
P=0.327>0.05, 尚不能认为两样本方差不齐,可以采用方差齐性假定满足的/检验结果,对应于 “Equal variances 
assumed”一 行。本例：/=_7.579, i><0.001 ，可以认为两种环境中运动者的心肌血流量 不同。 

如果方差齐性检验的结果中 P ^ a , 即两总体方差不齐，则应釆用/检验。 SPSS 的操作过程与上述两组 
独立样本的/检验相同，只是在选择/检验的结果时，需选择方差齐性假定不满足，即 “Equal variances not 
assumed" 所对应的那一行的结果即可。 

2.4.3 正态性检验 

Student /检验有两个应用 前提： 样本所来自的总体服从正态分布（即正态性)，以及两独立样本比较时， 
要求其所来自的两总体方差相等 ( 即方差齐性)。注意到，方差齐性的结果在进行两独立样本/检验的 SPSS 
结果中会自动给出。本节我们介绍一下如何对资料进行正态性检验，仍然结合例 7-3 的资料介绍。 

正态性检验可通过 “Analyze” 一► “Descriptive Statistics” — “Explore …”实现。在弹出的对话框左侧的变量 
列表中，选中观测指标“心肌流量”，单击按钮“命”，将变量选人到 “Dependent List” 列表 框中； 将分组变量 
“分组”，选入到 "Factor List” 框中。如附图44所示。 


：： ^1 



附图44 Explor 对话框 


单击 “Plots...” ，在弹出的对话框中，选中 “Normality plots with tests” ，点击 “Continue”。 最后单击 “OK” 完 
成。输出的主要检验结果 如下： 



正态性检验采用了两种 方法： Kolmogorov-Smirnov 法和 Shapiro-Wilk 法，分别给出了两组的统计量值 
(Statistic)、 自由度 （df) 和户值 (Sig.)。 其中， Shapim-Wilk 法主要适用于样本含量少于100的资料。本例，选 
择 Shapiro-Wilk 法的结果，正常 组：尸 =0.130; 低氧 组：尸 =0.781，两组的尸值均大于 0.10, 说明两组资料满足 
正态性假定，可采用 Students 检验。 






2.5 


方差分析 


2.5.1 完全随机设计的方差分析 

根据例 8-1 的资料介绍完全随机设计的方差分析。 

研究药物不同 剂蛰的 部分凝血活酶时间，数据录入如附图45所示。其中，分组变量为一列，本例为“注 
射剂量 ”（ 1 = “0.5U”、2 = “1U”、3 = “2U”）; 观测指标“部分凝血活酶时间”为一列。 



多个独立样本均数比较的方差分析可通过 “Analyze” —“Compare Means""One-Way Anova...” 实现。在 
弹岀的对话框左侧的变量列表中单击选择“部分凝血活酶时间 "，单 击按钮“命”，将变量选入到 "Dependent 
List” 中； 单击选择分组变量“注射剂量”，单击按钮“味”，将变量选人到“ FactorL i st ” 中。如附图46所示。 



附图46 One-Way ANOVA 对话框 


对于方差分析，可直接在附图46的界面上进行多重比较和方差齐性检验的定义， SPSS 将同时给出两者 
的结果。 

均数间多重比较的 实现： 单击 “Post Hoc...”， 在弹出对话框中选择多重比较的方法，再点击 “Continue” 返 
回主界面。 SPSS 提供了很多常用的多重比较方法, 包括： LSD、Bonf e m)ni、Sidak、SNK、Tuk e y、Dunnett 等，供 
用户根据研究需要进行选择。本例，选择 SNK 法。 

方差齐性检验的 实现： 单击 “Options...”, 在弹出的对话框中选择 “Homogeneity of variance test”， 然后单 
击 “Continue” 返回主界面。 

最后，单击 “OK” 完成。输出的主要结果 如下： 










结果 1 为进行多个独立样本方差齐性检验的 Levene 检验结果,依次输出检验统计量 (Levene Statistic) 和 
P 值 (Sig.)。 本例 Levene Statistic = 1.847, 尸 =0.1 77,表示各组48小时部分凝血活酶时间的观测值满足方差 
齐性。 

结果2为方差分析的结果，列出了方差分析表，从第一列其依次为变异来源、离均差平方和 （Sum of 
Squares)、 自由度 (df)、 均方 (Mean Square)、F 值 (F) 和尸值 (Sig.)。 其中，变异来源中，包括：组间 （Between 
Groups)、 组内（误差 )(Within Groups) 和总的 (Total)。 本例 F=6.524, P=0.005, 可以认为三种不同剂量48小 
时部分凝血活酶时间不全相同。 

结果3为 SNK 检验的结果，依次给出了比较的组别 （ 已按照均数由小到大排好序)、样本量 （N )、在 0.05 
水准下的检验结果 (Subset for alpha = 0.05), 其中，位于相同子集中的均数差异无统计学意义，位于不同子集 
中的均数差异有统计学意义。本例，剂量 1(0.5U) 和剂量 3(2U) 的均数均在子集1中，差异无统计学意义， 
而只有剂量 2( 1U) 的均数在子集2中，说明其与剂量1和剂量3差异均有统计学意义。因此，尚不能认为剂 
量1和剂量3的48小时部分凝血活酶时间不同，可认为剂量2与另外两个剂量的48小时部分凝血活酶时间 
均不同，剂量2的最长。 

2.5.2 随机区组设计的方差分析 

根据例 8-2 的资料介绍随机区组设计的方差分析。 

研究三种不同处理的大鼠 MT 含量，数据录人如附图47所示。其中，分组变量为一列，本例为“处理” 
(1 = “对照组”、2 = “氯化镉组”、3 = “Rgl +氯化镉组” ）; 区组变量为一列,本例为“窝别”；观测指标为一列，本 
例为 “MT 含量值”。 

随机区组设计的方差分析可通过 “Analyze” — "General Linear Model” — “Univariate...” 实现。在弹出的 
对话框中，将左侧的变量列表中 “MT 含量值”选人到 "Dependent Variable” 中； 将变量“处理”和“窝别”选入 
到 “FixedFactor(s)” 中。如附图48所示。 







附图 47 例 8-2 的数据集 附图48 Univariate 对话框 


单击 “Model...”， 在弹出对话框中的 “Specify Model” 下选择 “Custom” ； “Build TermU)” 中的 "Type:” 下选 
择 “Main effects", 然后将左侧 “Factors & Covariates” 中“处理”和“窝别”选人 “Model” 中； 在 "Sum of squares” 
下选择 “Type HI” ，将 “Include intercept in Model” 选中。然后单击 “Continue”。 如附图 49 所示。 




附图49 Univariate： Model 对话框 


点击 “Post Hoc. ••”，在 **Factor( S r 选择分组变量“处理”，单击按钮“味”，将变量选入到 “Post Hoc Tests 
for:” 中；在 "Equal Variances Assumed” 框中，选择多重比较的 方法。 本例’选择 "SNK” 法。 然后单击 “Continue” 。 
最后单击 “0K” 完成。输出的主要结果如下： 

(1) 方差分析的结果 

Tests of Between-Subjects Effects 

Dependent Variable： MT 含贵值 


a. R Squared = .975( Adjusted R Squared = .960) 















结果 （1) 是随机区组设计方差分析的结果，表中依次给出了变异来源 (Source)、DI 型离均差平方和 (Type 
HI Sum of Squares )、自由度 (df)、 均方 (Mean Square)、/ 7 值 (F) 和 *P 值 (Sig.)。 其中，变异来源包括：校正模型 
(Corrected Model), 常数项 (Intercept)、 治疗组、区组、误差 (Error)、 总变异 (Total )、校正的总变异 （Corrected 
Total)。 本例，处理对应的 F=341.919，_P<0.001， 可认为三种治疗方法缓解胃痛时间的总体均值不全相同。 

结果 ( 2 ) 是针对“处理”的 SNK 检验结果。本例，三种处理大鼠 MT 含量的总体均值两两均不相同。 

2.5.3 析因谢的方差分析 

根据例 8-5 的资料介绍析因设计的方差分析。 

研究四种不同处理的 BALF 中 IL~4 7jC 平，数据录人如附图50所示。其中，两个因素各为一列，1、2分别 
表示不同的 水平； 观测指标为一列，本例为 “IL_4 值”。 



析因设计的方差分析过程与节 2.5.2 介绍的随机区组方差分析的 SPSS 操作过程相似。均通过 “Analyze” — 
'♦General Linear Model” — “Univariate...” 实现。首先，在 Univariate 对话框中，将左侧的变量列表中 “IL_4 值” 
选入到 "Dependent Variable” 中； 将变量 “A 因素”和 “B 因素”选人到 “Fixed Factor(s)” 中。点击 “Model...” ， 
在弹出的对话框中的 “Specify Model” 下选择默认项 “Full factorial” ， 并单击 “Continue”。 最后单击 “0K” 完成。 
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输出的主要结果 如下： 


— w ::: 1 c： 

- T yP eIII SumofSqu 鹏 

df 

MeanSquare 

F 


A 因索 P 

B 因岽 

A 因索 * B 因索 

Error 

Corrected Total 

1512.560* 

61253.320 

250.650 

836.219 

425.691 

542.618 

63308.498 

2055.178 

1 

36 

40 

39 

61253.320 

836.219 

425.691 

15.073 

55.479 

28.242 


000 

000 

000 


a. R Squared = .736( Adjusted R Squared = .714) 



上表为本例的方差分析表，表中各列的意义同节 2.5.2 介绍的随机区组方差分析表，此处不再赘述。 
本例， “A 因素”对应的尸=16.629，/><0.001，可认为4组与决组11^值总体均数不相等；“8因素”对应的 
F=55.479, P<0.001, 可认为5,组 与尽组 IL4 值总体均数不 相等； “A 因素 *B 因素”表示 AB 的交互作用， 
其 F= 28.242, P<0.001, 说明 A 与 B 两处理因素之间存在交互作用。 

2.5.4 重复测量设计的方差分析 

根据例 8-6 的资料介绍重复测量设计的方差分析。 

研究三种麻醉诱导在五个时相的收缩压变化，数据录入如附图51所示。其中，处理因素为一列，本例 
为“诱导方法”，1 = “A” 、2 = “B” 、3 = “C” ；不同时间点的观测值各为一列，本例为不同诱导时相的患者收缩压 
测量值，从 T0-T4。 



重复测量设计的方差分析可通过 “Analysis” — “General Linear Model”“Repeated Measusres...” 实现。 

在弹岀的 “Repeated Measures Define Factor(s)” X 牙话框中， “Within-Subject Factor Name” 文本框中填入名 
称“诱导时 相”； 在 “Number of Levels” 文本框中填人数字 “5”，表示有5个时间点的 数据； 单击 “Arfd” 按钮，在 
Add 按钮右侧变量列表会出现“时点 (5)” ,点击 “Define” 按钮。 

在弹出的 “Repeated Measures ”对话框中，在左侧的变量列表中单击选择分析变量 “T0” ，单击按钮 












m 


附录 2 SPSS 统计软件上机实习 


将变量 “TO” 选人到 "Within-Subjects Variables (诱导时相) :” 变量列表中。对变量 “T1” 、 "72”、 “T3” 、 “T4” 也 
进行类似变量 “TO” 的操作。将分组变量“诱导方法”选人 “Between-Subjects FactorsU): ”列表框中。如附图 
52所示。 



单击 “0K” 完成。 输出的主要结果 如下： 

( 1 ) 受试对象内的方差分析表 

Tests ofWithin-Subjects Effects 


Measure： MEASURE」 


Source 

Type 1 Sum of Squares 

df 

Mean Square 

F 

Sig. 

诱导时相 Sphericity Assumed 

Huynh-Feldt 

2336.453 

2336.453 

2336.453 

2336.453 

2.715 

4.000 

1.000 

584.113 

2336.453 

106 

106 

106 

558 


= 

诱导时相 * 诱导方法 Sphericity Assumed 

837 

837 

837 

627 

627 

627 

627 

8 

5.430 

8.000 

2.000 

104.703 

154.272 

104.703 

418.813 : 

19 

_19. 

101 

101 

101 

.101 


000 

000 

Error (诱导时相） Sphericity Assumed 

Huynh-Feldt 

263 

263 

263 

263 

120 

120 

120 

120 

48 

32.577 

48.000 

12.000 

5.482 

8.077 

5.482 




(2) 受试对象间的方差分析表 

Tests of Between-Subjects Effects 


Measure： MEASURE」 


lr :t: 蛀 

ariable： Average 

df 

Mean Square 

F 

Sig. 

诱导方法 

1155433.080 

912.240 

946.480 

1 

2 

12 

1 155433.080 

456.120 

78.873 

14649.223 

5.783 

.000 

•017 


结果 （1 ) 为受试对象内的分析结果，其方差分析表报告的各列指标同节 2.5.2 介绍的随机区组方差 
分析表，此处不再赘述。本例，无论是否满足球对称假定，其检 验厂值与户值 (包括 Sphericity Assumed, 









Greenhouse-Geisser、Huynh-Feldt、Lower-bound) 相同，“麻醉诱导时相”对 应的尸 = 106.558 ， 尸< 0.001 ，说 
明不同时间点之间的差异有统计学 意义； “诱导时相 * 诱导方法”表示时间与处理的交互作用，其对应的 
F= 19.101, 尸 <0.001 ，说明时间与处理的交互作用有统计学意义。 

结果 （2) 为受试对象间的分析结果。本例，“诱导方法”对应的 F=5.783，P=0.017, 可认为不同诱导方法 
之间的差异有统计学意义。 

2.6 ^检验 


2.6.1 四格表资料的; f 2 裣验 

根据例 9-1 的资料介绍四格表资料的/检验。 

研究吲达帕胺片治疗原发性高血压，数据录人如附图53所示。其中，“组别”为分组变量，“治疗结果” 
为观测指标，“广为四格表资料中四个格子的频数，即不同组别下某个治疗结果出现的频数- 


«e Ed# \fiew 执 Irareform finalyze graphs yHies Add^s Wndow 脚 
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组别 i 治疗结果 i f I I ：■ Vi； | 


对照组有效 20.00 d 

对照组拓& 24.00 
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试验组 软 5.00 
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附图53表 9-1 对应的数据集 


注意到，四格表资料是已经经过整理的数据，而统计软件通常是根据原始数据进行分析的。因此，在做 
/检验前，首先需要用 T 对数据集进行加权。数据加权的过程同本章 2.3.1, 此处不再赘述。 

四格表资料的/检验可通过 “Analyze”“Descriptive Statistics” —“Ciosstabs...” 实现。在弹岀的对话框 
左侧的变量列表中选中行变量“组别 "，单 击按钮“令’,将变量选人到 "RowCs)" 列表框中，将列变量“治疗结 
果” 选人 “ColmraK s )’’ 列表框中。如附图54所示。 







附录 2 SPSS 统计软件上机实习 


点击 “Statistics” ，选择 “Chi-square” ；点击 “Continue”。 点击 “Cell” ，可以根据结果显示的需要，选择 
“Observed”（ 显示四个格子的实际频数)、 “Expected”( 计算四个格子的理论频数)， “Row”（ 显示行百分比）和 
“Column” ( 显示列百分比)及 “Total” ( 显示合计的行和列百分比)，点击 “Continue” 。 

最后，单击 “0K” 完成。输出的主要结果 如下： 



b. Computed only for a 2x2 table 

结果中分另 U 给出了 Pearson 卡方 (Pearson Chi-Square), 连续性校正的卡方 (Continuity Correction), 对数 
似然比方法计算的卡方 (Likelihood Ratio), Fisher’s 精确概率法 (Fisher’s Exact Test), 有效记录数 (N of Valid 
Cases) 等。 

每种方法对应的结果 包括： 统计量 (Value )、自由度 (df )、双侧近似尸值 (Asymp. Sig.( 2-sided)), 双侧确切 
P 值( Exact Sig.( 2-sided)) 和单侧 确切尸 值( Exact Sig.( 1-sided ))o 

并且，在表的下方通过备注的方式给出了是否满足 / 检验的条件，本例，“备注 a” 显示： “0 cellsC.O%) 
have expected count less than 5. The minimum expected count is 10.77.” 即没有格子的理论频数小于 5 ，最小的理 
论频数为10.77。因此，可采用 PeaiBon 卡方检验的结果，/= 8.399, 0.004,可以认为两组治疗原发性高血 
压的总体有效率不等，即可认为吲达帕胺片治疗原发性高血压是有效的。 

对于需要采用连续性校正的卡方检验，或者 Fisher 精确概率法计算时， SPSS 的操作过程相同，注意到， 
在输出的结果中，其实已经同时给出了上述两种方法的结果,大家只需要根据结果下方“备注 a” 的提示，来 
判断应该选择何种方法的输出结果即可。 

2.6.2 配对四格表资料的/检验 

根据例94的资料介绍配对四格表资料的/检验。 

研究两种培养基的阳性培养率，数据录入如附图55所示。其中， “A 培养基”、 “B 培养基”变量表示两种 
培养基的培养结果，“频数”变量表示两种培养基培养结果不同组合下的频数。 



附图55表 9-5 对应的数据集 


配对四格表资料的/检验操作过程与节 2A1 中的四格表/检验相同，要先进行数据加权 ( 本例中权重 
变量为“频数”），再进行/检验。唯一不同的是点击 “Statistics” 后，选择 “McNemar”。 






SPSS 软件的 “Crasstabs” 功能不输出 McNemar 检验的统计量值，仅输出尸值 [Exact Sig.(2-sided)L 本 
例，/ >=0.652, 尚不能认为两种培养基的阳性率不同。 

2.6.3 行 x 列表资料/检验 

根据例 9-5 的资料介绍行 x 列表资料的/检验。 

研究三种方案治疗急性肝炎的有效率，数据录入如附图56所示。 
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附图 56 表 9-6 对应的数据集 

行X列表资料的/检验操作过程与节 2.6.1 中的四格表/检验相同，要先进行数据加权，本例权重变量 
为“频数”。 

输出的主要结果 如下： 


Chi-Square Tests 



Value 

df 

Asymp. Sig.(2-sided) 

Pearson Chi-Square 

22.808* 

2 

.000 

Likelihood Ratio 

24.149 

2 

.000 

N of Valid Cases 

254 




a. 0 ceUs(.0%)have expected count less than 5. The minimum expected count is 31.76. 


结果中分别给出了 Pearson 卡方 (Pearson Chi-Square), 对数似然比方法计算的卡方 (Likelihood Ratio) 
和有效记录数 （N of Valid Cases)。 每种方法对应的结果 包括： 统计量 (Value)、 自由度 （df)、 双侧近似戶值 
(Asymp. Sig. ( 2-sided) ) 0 

本例 / = 22.808 ，尸 < 0.001 ，可认为三种疗法的有效率不全相等。 

需进一步进行两两比较时，可在校正检验水准《的基础上,分别对欲比较的两个组进行四格表/检验 
( 操作过程见节 2.6.1 )。校正《的原则与方法详见本书第9章。 

2.7 作参数检验 

2.7.1 配对资料的符号秩和检验 

根据例 10-1 的资料介绍配对资料的符号秩和检验。 





研究白癜风病人的 IL-6 指标在白斑部位与正常部位有无差异，数据录人如附图57所示。一名病人的两 
个部位的 IL6 指标放在同一行。 



附图57表 10-1 对应的数据集 


Wilcoxcm 符号秩和检验可通过 “Analy Ze ” — “N 0n param e tri C Test” — “2 Related Samples …”实现。在弹出 
的对话框左侧的变量列表中选中分析变量，单击按钮“命”，将变量“正常部位”和“白斑部位”选入到 “Test 
Pairs” 变量列表中的 “Variablel” 和 “Variable2” 中，并在 ‘Test Type” 中选择 “Wilcoxon” ， 如附图58所示。 





附图58 Two-Related-Samples Tests 对话框 


单击 “OK” 完成。主要输出结果 如下: 


Test Statistics 11 




Asymp. Sig.(2-tailed) 

-2.240* 

.025 



Wilcoxon 符号秩检验的主要检验结果 包括: 统计量 (Z) 和/>值( Asymp. Sig.(2-tailed) )。本例， Z=-2.240, 
P=0.025, 可认为白斑部位与正常部位的白介素有差异。 

2.7.2 两样本比较的秩和检验 

根据例 10-3 的资料介绍两样本比较的秩和检验。 

研究有无淋巴细胞转移的胃癌患者对生存时间的影响，数据录入如附图59所示。其中，“组别”为分组 
变量，1 =无淋巴细胞转移，2 =有淋巴细胞转移。 








两样本比较的 Wilcoxon 秩和检验可通过 “Analyze” —“Nonparametric Test” ~ Independent Samples..." 
实现。在弹出的对话框左侧的变量列表中选中分析变量“生存时间”，单击按钮“ 1 ♦”，将变量选人到 “Test 
Variable List” 列表框中，将变量“组别”选人到 “Grouping Variable” 变量列 表中。 并点击 “Defme Groups...", 
在弹出的对话框中，分别在 “Group 1”选框中输人1,在 -Group T 选框中输入2,单击 “Continue”。 在 "Test 
Type” 中，选择 -Mann-WhitneyU"o 如附图60所示。 










两组 Wilcoxon 符号秩和检验的主要结果包括 Mann-Whitney U 统计量 (Mann-Whitney U)，Wilcoxon fF 统 
计量 （Wilcoxon W)，Z 检验统计量 (Z), 近似双 侧尸值 (Asymp. Sig.(2-tailed)) 和确切 的尸值 { Exact Sig. [2* 
(1-tailed Sig.)]| 0 本例, Z=-2.172,P=0.030, 可认为两组患者的平均生存时间不同。 

对于等级资料的比较，所收集的资料如为频数表(见例 10-4), 则需先根据频数对数据进行加权，再釆用 
上述过程操作即可。需要注意的是，分组变量的赋值必须是数值型。 

2.7.3 多个样本比较的秩和检验 • 

根据例 10-5 的资料介绍多个样本比较的秩和检验。 

研究霍乱菌苗不同途径的免疫效果，数据录入如附图61所示。其中“滴度”为血清抗体滴度水平的编 
秩，滴度“1:10” 至“1:320” 依次编为“1”至 “6”； “广为各个滴度出现的 频数； “组别”为分组变量，1 =气雾组 
80亿 /ml ，2 =气雾组100亿 /ml, 3 =皮下注射组。 



本例为频数表资料,需先根据频数 T 对数据进行加权，方法参见节2.6-1。 

多个样本比较的 Kruskal-Wallis //检验可通过 “Analyze” 一 "NonparametricTest”一*• “K Independent Samples...” 
实现。在弹岀的对话框左侧的变量列表中选中分析变量“滴度”，单击按钮“命”,将变量选人到 “Test Variable 
List” 列表中，将分组变量“组别”选人到 "Grouping Variable” 变量列表中。再点击 “Define Range.. （分组变 
量的赋值范围，本例为1到3 )，在弹出的对话框中，在 “Minimum” 选框中输人“1”，在 “Maximum” 选框中输入 
“3”，单击 “Continue”。 在 "Test Type” 中，选择 “Kruskal-Wallis H”。 如附图62所示。 






附图62 Test for Several Independent Samples 对话框 


单击 “OK” 完成。输出的主要结果 如下： 





多个样本比较的 Kruskal-Wallis// 检验的主要结果包括统计量 (Chi-Square), 自由度 （df) 和尸值 (Asymp. 
Sig. )。本例，/ = 12.267, P=0.002, 可认为三组血清抗体滴度水平不全相等。 

2.8 线性回归与相关 

2.8.1 线性回归 

根据例 11-1 的资料介绍线性回归分析。 

研究饮水氟含量与成人骨X线改变指数的关系，数据录人如附图63所示。其中， “Y” 为应变量“成人骨 
X线改变指 数”； “X”为自变量“饮水氟含量”。 
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附图63表 11-1 的数据集 


两变量直线回归分析可通过 “Analyze” — “Regression” “Linear.. 实现。在弹出的对话框左侧的变量 
列表中选中应变量 “Y” ， 单击按钮“屮’ ， 将应变量选入 “Dependent”； 选中自变量“X” ， 单击按钮“兮”，将自 
变量选入 "IndependentCsT 列表中。如附图64所示。 


—— 










单击 “Statistics...” ，在弹出的对话框中 “Regression Coefficient” 下选择 “Estimates” 和 “Confidence intervals” 
分别输出回归系数的相关估计量及其95%可信 区间； 选择 “Model fit” ，输出拟合优度检验的相关信息。其 
中， “Estimates” 和 “Model fit” 为默认选项。然后单击 “Continue”。 

单击 “Save.. ，在弹出的对话框中 "Prediction Intervals" 下选择 “Mean” 和 “Individual” 可分别输出条件均 
数的95%可信区间和个体值的容许区间。然后单击 “Continue”。 

单击 “OK” 完成。输出的主要结果 如下： 

(1) 模型的拟合优度情况 


si Summary 6 



a. Predictors : (Constant), 饮水氣含 fi 

b. Dependent Variable: 骨 X 线改变指数 


(2) 模型的方差分析表 


ANOVA b 


Residual 



12537.411 

2025.728 

14563.139 


F Sig. 

43.324 CXK)' 


a. Predictors : (Constant), 饮水氟含量 

b. Dependent Variable: 骨 X 线改变指数 


(3) 回归系数的估计及其检验 


Coefficients 3 



Coefficients 



Sig. 

95.0% Confidence Interval for B 

B 

Std. Error 

Beta 

Lower Bound 

Upper Bound 

饮水氟含量 

-13.079 

9.939 

8.500 

.928 



-33.178 

6.368 

7.020 

13.510 


a. Dependent Variable: 骨 X 线改变指数 


结果 （1) 为所拟合模型的拟合优度情况，包括相关系数 （R)、 决定系数 （R Square)、 校正的决定系数 
(Adjusted R Square )、估计的标准误 (Std. Error of the Estimate )o 本例，相关系数为 0.928, 决定系数为 0.861 ， 
校正决定系数为0.841。 

结果 ( 2 )为模型的方差分析表，包括变异来源 (Model), 离均差平方和 (Sum of Squares )、自由度 (df )、均方 
(Mean Square)、 尸值 (F) 和尸值 (Sig.)。 本例， F=43.324,P<0.001, 表明所建立的模型有统计学意义。 

结果 (3) 为回归系数的估计及其检验，包括模型系数的 (Model)、 回归系数估计 (Unstandardized Coefficients), 
标准化回归系数 (Standardized Coefficients)、 ？值(1)、/>值 (Sig.)、 回归系数的95% 可信区间(95.0% Confidence 
Interval for B)o 本例，回归方程的常数项为-13.079、回归系数为 9.939, 回归系数的检验/ =6.582, P<0.001, 
说明饮水氟含量 U) 与骨X线改变指数 (D 之间存在直线回归关系，回归方 程为: f=-13.08 + 9.94A 
2.8.2 线性相关 

根据例1 1-2 的资料介绍线性相关分析。 

研究男青年身高与前臂长的相关性，数据录人如附图65所示。其中，“X”为 身高； “Y” 为前臂长。 






两变量简单线性相关分析可通过 "Analyze"- "Correlate"-* l Biovariate..." 实现。在弹出的对话框左侧 
的变量列表中选中要分析的变量，单击按钮“今”,将变量选人到 “Variables” 变量列表中，本例为“身高 [XJ’ 
和“前臂长 [Y ]”。在 “Correlation Coefficients" 框中选择 “Pearson” ,表示做线性相关分析。如附图66所示。 
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附图 66 Bivariate Correlations 对话框 


单击 “OK” 完成。输出的主要结果 如下： 


Correlations 



身高 

前臂长 

身高 Pearson Correlation 

Sig.(2-taaed) 

N 

11 

•801" 

.003 

前臂长 Pearson Correlation 

Sig.( 2-tailed) 

N 

.801“ 

.003 

11 



主要结果以矩阵的形式给岀，包括两变量的 Pearson 相关系数 (Pearson Correlation)、 总体相关系数假设检 
验的尸 值( Sig.(2-tailed)), 样本量 (N )。本例， r=0.801, 尸 =0.003 ，说明身高与前臂长之间存在线性相关关系。 





附录 2 SPSS 统计软件上机实习 


附图67表 12-5 对应的数据集 

多元线性回归分析可通过 “Analyze” — “Regression” — “Linear...” 实现。在弹出的对话框左侧的变量列 
表中选中应变量糖化血红蛋白（10,单击按钮“今”，将变量选入到 “Dependent” 框中；选择自变量，单击按钮 
“今’，将其放入 “Independent” 列表中，本例自变量为年龄(不)、体重指数 U 2 )、总胆固醇 U 3 )、收缩压 U 4 ) 和 
舒张压 (X 5 )。 

在 “Method 框中选择自变量方法， SPSS 提供了 5个 选项： “Enter” 为全部自变量进人法，是系统的默认 
值； “Remove” 为消 去法； “Forward” 为向 前法； “Backward” 为向 后法； “Stepwise” 为逐步回归法。本例，选择 
“Stepwise”。 如附图68 所示。 






附图68 Linear Regression 对话框 



















结果 （1 )为逐步法中每一步所拟合模型的拟合优度情况简表，包括复相关系数 （R )、决定系数 （R 
Square )、校正决定系数 (Adjusted R Square )、估计标准误 (Std. Error of the Estimate )。由表及其备注可知，本例 
共进行了 3步筛选，其中模型1仅含有 X3 、模型2含有 X3 和 X2 、模型3含有 X3 、 X2 和 X4。 最后一个模型， 
即模型3为最优模型，复相关系数为0.819,决定系数为 0.671, 校正决定系数为0.610。 

结果 (2) 为逐步法中每一步所拟合模型的方差分析表，包括模型序号及变异来源 (Model)、 离均差平方 
和 (Sum of Squares ) 、自由度 (df )、均方 (Mean Square ) 、尸值 (F ) 和尸值 (Sig. )。本例，3个模型均有统计学意义， 
其中，最优模型(模型3 ) 对应的尸=10.889,尸=0.000。 

结果 ( 3 ) 为模型参数的估计及检验结果,包括模型序号及包含的自变量 (model )、未标准化的偏回归系数 
及其标准误 (unstandardized coefficients )、标准化偏回归系数 (standardized coefficients )、/值(1)、尸值(3龟.)。最 
后得到的回归方 程为： f=4.799 + 0.03 UT 2 +0.097 不+0.00肛 4 ,可以认为体重指数 U 2 )、 总胆固醇(石)和收缩 
压 U 4 ) 是影响糖化血红蛋白00的主要因素。 


2.10 logistic 回归 


2.10.1 二分类资料的 logistic 回归 

根据例 13-2 的资料介绍二分类资料的 logistic 回归。 

研究某种药物治疗骨折效果，数据录入如附图69所示。其中， state 为分层 因素； n 为每层观察到的频 
数； Y 为疗效评价：0 =差，1 =好；乂1为骨折类型：0=闭合，1 = 开放； X2 为是否手术：0=非手术，1 = 手术； 
X3 为是否服药： 0 =未服药 ， 1 = 服药； X4 为治疗时间 ： 1 = “1周〜” ， 2=“11周〜” ， 3 = “21周〜”。 



本例观察到的资料为每层下的例数(频数表资料），需首先对原始数据进行加权，加权的方法参见节 
2.6.】。本例，权重变量为 “n”。 

二分类资料的 logistic 回归可通过 “A na ly Ze ” — “R egresS i 0 n”->“Binary logistic...” 实现。在弹出的对话 
框左侧的变量列表中选中应变量 Y, 单击按钮“味”，将应变量选入到 “Dependent” 栏框中，本例应变量为 
疗效评价 (Y); 在弹出的对话框左侧的变量列表中选中所要分析的自变量，单击按钮“今”，将自变量选入 
“Covariates” 列表框中。在下方的 “Method” 列表中选择 “Forward: LR”。 如附图70所本。 
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附图70 Logistic Regression 对话框 


单击 “Categorical...” ，赋哑变量。将需赋哑变量的自变量选人 “Categorical Covariates” 列表框中，本例选 
入 X4。 在 "Change Contrast” 中定义哑变量赋值的对照水平。本例选择 “Reference Category” 为 “First” ，再单 
击 “Change”， 以完成对照水平的定义，本例为以第一水平为对照组。单击 “Continue”。 如附图71所示。 



附图71賦哑变置的对话框 


单击 “Options...” ，选择 “Cl for exp(B)： 95%”,表示输出⑽值及其95%可信区间。并在 “Probability for 
Stepwise” 中键入纳入 (Entry:) 、剔除 (Removal:) 标准。本例为0.05、0.10。单击 “Continue” 。 

最后，单击 “0K” 完成。输出的主要结果 如下： 









主要结果中包括所进行的逐步回归的过程，以及每一步的 logistic 回归模型情况。其中，第一列中的 
Step 表示逐步回归的过程，每一步包含哪些自 变量； 第二列开始为回归模型的情况， 包括： 偏回归系数 (B)、 
标准误 (SE)、Wald 检验统计量 (Wald)、 自由度 (df)、 尸值 (Sig)、 0及值 (Ex P (B)) 和⑽的95%可信区间（95% 
C.I.forEXP(B)) 0 

本例，共进行了两步筛选，第一步 (Stepl ) 仅入选了一个自变量 X4; 第二步 (Ste P 2) 入选了两个自变量 
X3、X4, 为最终方程。这两个自变量回归系数的 Wald 检验尸值均具有统计学意义(/ ><0.001 )，提示它们是 
骨折治疗效果 （r) 的独立影响因素。在相同的治疗时间条件下，服药骨折病人获得好疗效的可能性比不服 
药骨折病人更大,其优势比为 10.060; 在相同的服药情况下，治疗时间越长获得好的疗效的可能性越大，其 
中治疗周数在11周以上相对于11周以下的优势比为14.638,治疗周数在21周以上相对于11周以下的优势 
比为 116.863。 

2.10.2 条件 logistic 回归 

根据例 13-3 的资料介绍条件 logistic 回归。 

研究胃癌发病的危险因素，数据录入如附图72所示。其中，自变量(XI〜 X7) 与应变量 (Y) 的赋值情况 
同表13-9,此处略。由于 SPSS 进行条件 logistic 回归时需借助生存分析的相关模块完成，因此，在数据集中 
虚拟了一个时间变量 “time”， 其本身的赋值没有实际意义，赋值也不会影响最终的输出结果。需要注意的 
是，通常假定对照组的存活时间长于病例组，因此在赋值时，对照组的时间需大于病例组的时间。本例，病 
例组的 time = 1，对照组的 time = 2。 



条件 logistic 回归可通过 “Analyze”—>“Survival”一♦■ “Cox Regression...” 实现。在弹出的对话框左侧的变量 
列表中选中时间变量 time, 单击按钮“令’，将时间变量选人到 "Time” 框中，将应变量 Y 选人到 “Status” 框中， 
点击 "Define Event” (定义事件赋值)录人“1” ；将自变量选人 “Covariates” 列表框中，并在下方的 “Method” 列 
表中选择 “Backward: Wald”。 将“配对变量”选人 “Strata” 框中。如附图73所示。 

单击 “Options …”，选择 “Cl for exp(B)： 95%”，表示输出⑽值及其95%可信区间。并在 "Probability for 
Stepwise” 中键人纳入 (Entry:) 、剔除 (Removal:) 标准。本例为0.15、0.20。单击 “Continue” 。 
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最后，单击 “0K” 完成。输出的主要结果如下: 



主要结果与节 2.10.1 中介绍的二分类 logistic 回归结果类似，可参考学习。本例，第四步得到的方程 
为最终方程，其中含有4个自变量喜盐溃食物及重盐饮食 (X4)、 不良饮食习惯 (X5)、 吸烟 （X6)、 精神因素 
(X7)。 均为危险因素，其对应的 ⑽值 分别为1.497、2.414、2.297和3.162。可见，改变喜盐渍食物及重盐饮 
食、不良饮食习惯、吸烟等嗜好、减少负面的精神因素，可降低患胃癌的风险。 
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2.11 生存分析 

2.11.1 生存率的估计、生存曲线的绘制与比较 

根据例1«的资料介绍生存率的估计、生存曲线的绘制与比较。 

研究乳腺癌的生存率，数据录入如附图74所示。其中，“生存时间”为患者从手术后到患者复发的时间 
(个 月）; “结局”为患者的生存情况：0=未复发(删失)，1 = 复发； “组别”为分组因素：1 =肿瘤直径幻 cm, 2 = 
肿瘤直径 > 5cm。 
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附图74例 14-2 的数据集 


生存率的估计、生存曲线的绘制与比较可通过 “Analyze” — “Survival” — "Kaplan-Meier..." 实现。在弹 
出的对话框左侧的变量列表中选中“生存时间”，单击按钮“今”，选人 "Time： ” 框中； 选中“结局”，单击按钮 
“♦’ ，选人 “Status :”框中； 选中“组别”，单击按钮“味”，选人到 "Factor： ”框中。如附图75所示。 








附图75 Kaplan-Meier 对话框 

单击 “Status:” 下方的 “Define Event...” ，定义事件发生的赋值。本例为“复发”，取值为“1”。在弹出的对 
话框中， *Value(s)indicating event has occurred*’ 下选择 Single value: ”，在其后的框中键人 “1”。单击 “Continue”。 
单击 “Compare Factor...", 在弹出的对话框中， “TestStatistics” 下，选择 “Logrank” 。单击 “Continue” 。 

单击 “Options...” ，在弹出的对话框中， “Statistics” 下选择 “Survival table(s)” 和 “Mean and median survival” 
以显示不同时间点的生存率以及生存时间的均数和中 位数; 选择 “Plots” 下的 “Survival” 以绘制生存曲线。单 













(3) 生存时间的均数和中位数情况 



组别 

Mean* 

Median 

Estimate 

Std. Error 

95% Confidence Interval 

Estimate 

Std . Error 

95% Confidence Interval 

Lower Bound 

Upper Bound 

Lower Bound 

Upper Bound 

2 

Overall 

29.143 

37.772 

4.554 ! 

35.032 

20.613 

28.845 

37.673 

46.698 

24.000 

28.000 

3.052 

2.824 

18.019 

22.466 

29.981 

33.534 


a. Estimation is limited to the largest survival time if it is censored. 


(4) 两组生存曲线比较的 log n 


止检验结果 

_Overall Comparisons 




Test of equality of survival distributions for the different levels of 组别 . 

(5) 两组生存曲线比较图（附图76 ) 



附图 76 两组生存曲线图 

结果 （ 1 ) 为病例情况的概述，包括组别、分析的病例总数 (Total N )、 发生事件的病例数 (N of Events )、截 
尾病例的情况 (Censored )。 本例，组 1 ( 肿瘤直径幻㈣)、组 2 ( 肿瘤直径 > 5cm) 分别分析15例、22例，共分析 
36 例； 其中，组1复发9例，截尾6例，截尾病例占40.0%;组2复发21例，截尾0 例； 两组共复发30例，截 
尾6 例 ，截尾病例占16.7 %。 

结果 (2) 为不同组别中每个病例的生存情况，包括组别、生存时间 (Time)、 生存状态 (Status)、 累计生存 
率 ( Cumulative Proportion Surviving at the Time )、 事件的累计发生例数 (N of Cumulative Events )、 未发生事件的 
例数 (N of Remaining Cases )。本例事件定义为“复发”。 

结果 （3) 为生存时间的均数和中位数情况，包括组别、生存时间的均数 （Mean)、 生存时间的中位数 
(Median), 反映的均数和中位数的信息包括估计值 (Estimate )、 标准误 (Std. Error), 95%可信区间 （ 95% 
Confidence Interval ) 0 本例，组 1( 肿瘤直径幻 cm) 生存时间的中位数为 46.000 个月，标准误为 16.738 个月， 
95 %可信 区间为 （ 13.193, 78.807) 个月； 组 2( 肿瘤直径 >5cm) 生存时间的中位数为 24.000 个月， 标 准误为 
3.052 个月，95 %可信 区间为 （ 18.019, 29.981) 个月。 
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结果 （4 ) 为两组生存曲线比较的 log rank 检验结果，包括检验统计量 (Chi-Square)、 自由度 （d£)、P 值 
(Sig.)o 本例，/ = 6.351，尸 =0.012, 可认为肿瘤直径幻 cm 的患者较肿瘤直径 >5cm 的患者生存曲线不同。 

结果 （ 5 ) 为两组生存曲线比较图。图中随访时间为横轴,生存率为纵轴“+”表示在对应的生存时间(个 
月 ） 上出现了截尾病例。实线代表组1,虚线代表组2,图中显示组 1( 肿瘤直径 <2cm) 生存曲线较高、下降比 
较平缓，而组 2( 肿瘤直径 > 5cm )生存曲线较低、下降陡峭，故肿瘤直径幻 cm 的患者较肿瘤直径 > 5cm 的患 
者生存率高，复发率低。 

2.11.2 多变量 C0X 回归分析 

根据例 14-4 的资料介绍多变量 Cox 回归分析。 

研究乳腺癌患者手术治疗后生存率的影响因素，数据录人如附图77所示。其中，自变量(XI〜 X6) 与生 
存时间 （t )、生存结局 （Y) 的赋值情况同表144,此处略。 






B 
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nil 



附图77例144的数据集 


Cox 回归分析可通过 “A na l yze ”-"Survi™T-“C 0 x Regression...” 实现。在弹出的对话框中左侧的变量 
列表中，选中生存时间变量,单击按钮,选人到 "Time :” 框中,本例为 “t” ；选中生存状态变量,单击按钮 
“兮”，选人到 -Status:" 框中，本例为 “Y” ,并单击 -Define Event...” 定义事件发生的赋值，方法参见节 2.11.1; 
选中所有的自变量，单击按钮“兮”,选入到 “Covariates” 框中，本例为 “X1”〜“X6”。 并在 “Method” 下拉菜单 
中选择 -Forward: wald", 以筛选自变量,否则默认为 "Enter", 全部自变量均进人模型。如附图78所示。 
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附图 78 Cox Regression 对话框 






单击 “Options...”， 在 “Model Statisitcs” 下，选择 “Cl for exp(B)”， 以输出 HR 的95% 可信 区间； 在 
"Probability for Stepwise” 下的 “Entry: ”和 “Removal: ”后面的框中分别输人进行逐步回归的纳人、剔除标准， 
本例分别为0.05、0.10。单击 “Continue”。 

单击 “0K” 完成。输出的主要结果 如下： 




Variables in the Equation 



结果给出了进行 Cox 逐步回归分析的每一步的估计情况，包括每一步的模型中所含有的自变量（第一 
列）、回归系数 （B)、 回归系数的标准误 (SE)、Wald 检验统计量 (Wald)、 自由度 

(B) )、洲的95%可信区间 （95.0%CI for Ex P (B) )。由结果可见,共进行了 2步回归，最终模型中含有两个自 
变量 ：淋巴 结转移 (X3) 和肿瘤大小 (X4), 两者的 HR>1， 说明它们是影响乳腺癌患者术后复发的危险因素。 
在肿瘤大小相同的情况下，有淋巴结转移者的复发风险是无淋巴结转移者的 4.711 倍； 同样，在淋巴结转移 
情况相同时，肿瘤大小每增加一级，复发风险增加 2.609 倍。 

2.12 随机数的生成 

结合表 15-1 介绍可重现的随机数生成方法。在 SPSS 中可通过以下步骤生成可重现的随 机数： 

( 1 ) 在生成随机数之前，先定义种子数。可通过 ‘Transfonn” — “Random Number Generators. • 实现。在 
弹出的对话框中 “Active Generator Initialization” 下选择 “Set Starting Point” 中的 “Fixed Value” ，在 “Value :” 后 
的框中键人预设的种子数，本例设置固定种子数为2013。单击 “0K” 完成。如附图79所示。 



附图79 Random Number Generators 对话框 


(2) 在空的数据集中第一列输入变量“顺序号”，即想要生成的随机数的数量。 

(3) 生成随机数。通过 ‘^Transform” — "Compute Variable...” 实现。在弹出的对话框左侧 “Target Variable：" 
框中键人所生成的随机数欲对应的变量名，本例为“随机 数”； 在右侧的 “Function group： M 中先选择 “Random 
Numbers", 再从其下方的 “Functions and Special Variables： M 列表中选择欲生成的随机数的分布类型， SPSS 提 





供多种分布类型的随机数，包括 / 分布、正态分布、 F 分布、 Poisson 分布等，本例，选择生成均匀分布的随机 
数 “Rv. Uniform”。 点击按钮“食”。在 “Numeric Expression:” 框中的 “RV. UNIFORM(?，？)” 函数内显示的 “?” 
处定义随机数的取值范围，分别输人最小值“1”、最大值“20”，该范围可由用户自行定义。单击 “0K” 完成。 
如附图80所示。 



附图80 Compute Variable 对话框 

(4) 对随机数排序。通过 “Tnm s f orm ”-»"Rank Cases..." 实现。在弹出的对话框中，将左侧的“随机数” 
选中，单击按钮“味”，将“随机数”选人到 “VariableU):” 框中。单击 “0K” 完成。如附图81所示。 

(5) 根据随机数的秩次和分组原则进行分组。 
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附图81 Rank Cases 对话框 


经过 h 述5步操作，可得刻如附图82所示的数据集，其中 “R 随机数”为随机数的秩次，“组别”为根据 
分组原则进行分组后的组号。为了简便易读，数据集中所有的变量均定义为整数。可见，前三位受试者进 
人第二组，第四位至第九位受试者进人第一组，第十位受试者进人第二组，依此类推。 
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_ 续表 

分母的 分子的自由度 y, 

自由度 A 1 23456789 10 11 12~ 

26 4.22 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.18 2.15 

7.72 5.53 4.64 4.14 3.82 3*59 3.42 3.29 3.17 3.09 3.02 2.96 

27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.30 2.25 2.20 2.16 2.13 

7.68 5.49 4.60 4.11 3.79 3.56 3.39 3.26 3.14 3.06 2.98 2.93 

28 4.20 3.34 2.95 2.71 2.56 2.44 2.36 2.29 2.24 2.19 2.15 2,12 

7.64 5.45 4.57 4.07 3.76 3.53 3.36 3.23 3.11 3.03 2.95 2.90 

29 4.18 3.33 2.93 2.70 2.54 2.43 2.35 2.28 2.22 2.18 2.14 2.10 

7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.08 3.00 2.92 2.87 

30 4.17 3.32 2.92 2.69 2.53 2.42 2.34 2.27 2.21 2.16 2.12 2.09 

7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.06 2.98 2.91 2.84 

32 4.15 3.30 2.90 2.67 2.51 2.40 2.32 2.25 2.19 2.14 2.10 2.07 

7.50 5.35 4.46 3.97 3.66 3.42 3.25 3.12 3.01 2.94 2.86 2.80 

34 4.13 3.28 2.88 2.65 2.49 2.38 2.30 2.23 2.17 2.12 2.08 2.05 

7.44 5.29 4.42 3.93 3.61 3.38 3.21 3.08 2.98 2.89 2.82 2.76 

36 4.11 3.26 2.86 2.63 2.48 2.36 2.28 2.21 2.15 2.10 2.06 2.03 

7.39 5.25 4.38 3.89 3.58 3.35 3.18 3.04 2.94 2.86 2.78 2.72 

38 4.10 3.25 2.85 2.62 2.46 2.35 2.26 2.19 2.14 2.09 2.05 2.02 

7.35 5.21 4.31 3.86 3.54 3.32 3.15 3.02 2.91 2.82 2.75 2.69 

40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.07 2.04 2.00 

731 15.18 4.31 3.83 3*51 3.29 3.12 2.99 2.88 2.80 2.73 2.66 

42 4.07 3.22 2.83 2.59 2.44 2.32 2.24 2.17 2.11 2.06 2.02 1.99 

7.27 5.15 4.29 3.80 3.49 3.26 3.10 2.96 2.86 2.77 2.70 2.64 

44 4.06 3.21 2.82 2.58 2.43 2.31 2.23 2.16 2.10 2.05 2.01 1.96 

7.24 5.12 4.26 3.78 3.46 3.24 3.07 2.94 2.84 2.75 2.68 2.02 

46 4.05 3.20 2.81 2.57 2.42 2.30 2.22 2.14 2.09 2.04 2.00 1.97 

7^1 5.10 4.24 3.76 3.44 3.22 3.05 2.92 2.82 2.73 2.66 2.60 

48 4.04 3.19 2.80 2.56 2.41 2.30 2.21 2.14 2.08 2.03 1.99 1.96 

7.19 5.08 4.22 3.74 3.42 3.20 3.04 2.90 2.80 2.71 2.64 2.58 

50 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.02 1.98 1.95 

7.17 5.06 4.20 3.72 3.41 3.18 3.02 2.88 2.78 2.70 2.62 2.56 

60 4.00 3.15 2.76 2.52 2.37 2.25 2.17 2.10 2.04 1.99 1.95 1.92 

7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.56 2.50 

70 3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07 2.01 1.97 1.93 1.89 

7.01 4.92 4.08 3.60 3.29 3.07 2.91 2.77 2.67 2.59 2.51 2.45 

80 3.96 3.11 2.72 2.48 2.33 2.21 2.12 2.05 1.99 1.95 1.91 1.88 

6.96 4.88 4.04 3.56 3.25 3.04 2.87 2.74 2.64 2.55 2.48 2.41 

100 3.94 3.09 2.70 2.46 2.30 2.19 2.10 2.03 1.97 1.92 1.88 1.85 

6.90 4.82 3.98 3.51 3.20 2.99 2.82 2.69 2.59 2.51 2.43 2.36 

125 3.92 3.07 2.68 2.44 2.29 2.17 2.08 2.01 1.95 1.90 1.86 1.83 

6.84 4.78 3.94 3.47 3.17 2.95 2.79 2.65 2.56 2.47 2.40 2.33 

150 3.91 3.06 2.67 2.43 2.27 2.16 2.07 2.00 1.94 1.89 1.85 1.82 

6.81 4.75 3.91 3.44 3.14 2.92 2.76 2.62 2.53 2.44 2.37 2.30 

200 3.89 3.04 2.65 2.41 2.26 2.14 2.05 1.98 1.92 1.87 1.83 1.80 

6.76 4.71 3.88 3.41 3.11 2.90 2.73 2.60 2.50 2.41 2.34 2.28 

400 3.86 3.02 2.62 2.39 2.23 2.12 2.03 1.96 1.90 1.85 1.81 1.78 

6.70 4.66 3.83 3.36 3.06 2.85 2.69 2.55 2.436 2.37 2.29 2.23 

1000 3.85 3.00 2.61 2.38 2.22 2.10 2.02 1.95 1.89 1.84 1.80 1.76 

6.66 4.62 3.80 3.34 3.04 2.82 2.66 2.53 2.43 2.34 2.26 2.20 

oo 3.84 2.99 2.60 2.37 2.21 2.09 2.01 1.94 1.88 1.83 1.79 1.75 

6.64 4.60 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.24 2.18 
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附表 11 r 界值表(双侧尾部面积） 


0 : 02 ! 


EE = S_S = = = = _IE!_ = E = S = = = = 

1.O00SSZ ㈣ EE = = _ = IE_ = = E = S = _E = 

l-s = = = s-=r=s-s = _ = s = El = = ! = 
ys_s!=!=_=ss=srE_=_=ES= 

ylEil = _ = s = __SEi = -s = = s_I!E! 

i_=lrrll=___=__====l_r=ll 讓 ■==■1=11 

l__=_=ll_===y _=== 讀 i_===l_m==r_l! 

= = SEES = = = S = SIFS_E_SESI 

. 707 . 500 . 404 . 347 . 309 . 281 . 260 . 242 . 228 . 216 . 206 . 197 . 189 . 182 . 176 . 170 . 165 . 160 . 156 . 152 . 148 . 145 . 141 . 138 . 136 . 133 . 131 . 128 . 126 . 124 . 122 . 120 . 118116 . 115 . 113 . 111 . 110 . 108 . 1071 . 104 . 103 . 102 . 101 . 1001 . 098.097 
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附表12 界值表 

概率 ,P - 

单侧: 025 010 005 0025 001 0005 0.0025 0001 0.0005 

双侧： 0.50 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001 

0600 L000 um 

0.500 0.800 0.900 1.000 1.000 


0.371 0.657 0.829 0.886 0.943 1.000 1.000 

0.321 0.571 0.714 0.786 0.893 0.929 0.964 1.000 

0.310 0.524 0.643 0.738 0.833 0.881 0.905 0.952 

0.267 0.483 0.600 0.700 0.783 0.833 0.867 0.917 

0.248 0.455 0.564 0.648 0.745 0.794 0.830 0.879 




0.236 0.427 0.536 0.618 0.709 0.755 0.800 0.845 0.873 

0.217 0.406 0.503 0.587 0.678 0.727 0.769 0.818 0.846 

0.209 0.385 0.484 0.560 0.648 0.703 0.747 0.791 0.824 

0.200 0.367 0.464 0.538 0.626 0.679 0.723 0.771 0.802 

0.189 0.354 0.446 0.521 0.604 0.650 0.700 0750 0.779 


0.182 0.341 0.429 0.503 0.582 0.635 0.679 0.729 

0.176 0.328 0.414 0.503 0.582 0.635 0.679 0.729 

0.176 0.328 0.414 0.485 0.566 0.615 0.662 0.713 

0.170 0.317 0.401 0.472 0.550 0.600 0.643 0.695 

0.161 0.299 0.380 0.447 0.520 0.570 0.612 0.662 

0.156 0.292 0.370 0.435 0.508 0.556 0.599 0.648 

0.152 0.284 0.361 0.425 0.496 0.544 0.586 0.634 

0-148 0.278 0.353 0.415 0.486 0.532 0.573 0.622 

0.144 0.271 0.344 0.406 0.476 0.521 0.562 0.610 

0.142 0.265 0.337 0.398 0.466 0.511 0.551 0.598 




26 0.138 0.259 0.331 0.390 0.457 0.501 0.541 0.587 0.619 

27 0.136 0.255 0.324 0.382 0.448 0.491 0.531 0.577 0.608 

28 0.133 0.250 0.317 0.375 0.440 0.483 0*522 0.567 0.598 

29 0.130 0.245 0.312 0.368 0.433 0.475 0.513 0.558 0.589 

30 0.128 0.240 0.306 0.362 0.425 0.467 0.504 0.549 0.580 


31 0.126 0.236 0.301 0.356 0.418 0.459 0.496 0.541 0.571 

32 0.124 0.232 0.296 0.350 0.412 0.452 0.489 0.533 0.563 

33 0.121 0.229 0.291 0.345 0.405 0.446 0.482 0.525 0.554 

34 0.120 0.225 0.287 0.340 0.399 0.439 0.475 0.517 0.547 

35 0.118 0.222 0.283 0.335 0.394 0.433 0.468 0.510 0.539 


36 0.116 0.219 0.279 0.330 0.388 0.427 0.426 0.504 0.533 

37 0.114 0.216 0.275 0.325 0.382 0.421 0.456 0.497 0.526 

38 0.113 0.212 0.271 0.321 0.378 0.415 0.450 0.491 0.519 

39 0.111 0.210 0.267 0.317 0.373 0.410 0.444 0.485 0.513 

40 0.110 0.207 0.264 0.313 0.368 0.405 0.439 0.479 0.507 

41 0.108 0.204 0.261 0.309 0.364 0.400 0.433 0.473 0.501 

42 0.107 0.202 0.257 0.305 0.359 0.395 0.428 0.468 0.495 

43 0.105 0.199 0.254 0.301 0.355 0.391 0.423 0.463 0.490 

44 0.104 0.197 0.251 0.298 0.351 0.386 0.419 0.458 0.484 

45 0.103 0.194 0.248 0.294 0.347 0.382 0.414 0.453 0.479 

46 0.102 0.192 0.246 0.291 0.343 0.378 0.410 0.448 0.474 

47 0.101 0.190 0.243 0.288 0.340 0.374 0.405 0.443 0.469 

48 0.100 0.188 0.240 0.285 0.336 0.370 0.401 0.439 0.465 

49 0.098 0.186 0.238 0.282 0.333 0.366 0.397 0.434 0.460 

50 _ 0.097 0.184 0.235 0.279 0.329 0.363 0.393 0.430 0.456 
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I 类错误 type I error 66 
D 类错误 type II error 66 
Cox 比例风险回归模型 Cox proportional hazards 
regression model, PHREG 145 
Fisher 确切概率法 Fisher’s exact test 86 
Kruskal-Wallis 检验 Kruskal-Wallis test 99 
logistic 回归分析 logistic regression analysis 125 
f 分布 /-distribution 52 
Wald 检验 Wald test 128 
Wilcoxon 符号秩检验 Wilcoxon signed-rank test 
95 

Wilcoxon 秩和检验 Wilcoxon rank sum test 97 
; ^检验 chi-square test 84 
A 

安慰剂对照 placebo control 153 

B 

百分条图 percentage bar chart 46 

百分位数 percentile 12 

半对数线图 semi-logarithmic linear chart 41 

备择假设 alternative hypothesis 56 

比数比 odds ratio, OR 126 

变量 variable 3 

变异 variation 3 

变异系数 coefficient of variation 15 
标准差 standard deviation 14 
标准对照 standard control 153 
标准化回归系数 standardized regression coefficient 
118 

标准化率 standardized rate 30 


参数检验方法 parametric test 95 
常数项 constant term 104 
超几何分布 hypergeometric distribution 86 
重复 replication 155 

重复测量设计 repeated measurement design 80 
抽样误差 sampling error 4, 50 
处理因素。 treatment 151 

D 

单独效应 simple effect 78 

单盲 single blind 156 

单样本 / 检验 one-sample /-test 60 

等效性 equivalence, 157 

点估计 point estimation 51 

定量数据 quantitative data 3 

定性数据 qualitative data 3 

对照 control 153 

多重比较 multiple comparison 75 

多元线性回归 multiple linear regression 114 


发病率 incidence rate 32 
方差 variance 14 

方差分析 analysis of variance, ANOVA 70 
方差齐性 homogeneity of variance 62 
非比例风险模型 non-proportional hazards model 
148 

非参数检验方法 nonparametric test 95 
非劣效性 non-inferiority 157 
分位数-分位数图 quantile-quantile plot, Q-Q plot 





G 

概率 probability 4 
概率分布 probability distribution 4 
概率-概率图 (probability-probability plot, P-P plot) 
25 

构成比 proportion 28 
H 


连续性校正法 correction for continuity 
两独立样本 / 检验 two-sample /-test 62 
两因素方差分析 two-way ANOVA 73 
临床试验 clinical trial 155 
率 rate 28 

率的标准误 standard error of rate 51 
M 


合并方差 pooled variance 62 
患病率 prevalence rate 32 
回归系数 regression coefficient 104 
J 

极差 range 13 
几何均数 geometric mean 10 
计分检验 score test 128 
假设检验 hypothesis test 55 
检验效能 power of a test 67 
简单相关 simple correlation 108 
交叉设计 cross-over design 156 
交互效应 interaction effect 78 
校正决定系数 adjusted R-square 119 
截距 intercept 104 

近似 ？ 检验 separate variance estimation /-test 63 
精密度 precision 153 

决定系数 coefficient of determination 111, 119 
均数的标准误 standard error of the mean 50 
K 

可信区间 confidence interval, Cl 51 
可信限 confidence limit 51 
空白对照 blank control 153 


累积生存概率 cumulative probability of survival 
140 

离均差平方和 sum of squares 14 
理论频数 theoretical frequency 84 
历史对照 historical control 154 


盲法 blind method 156 
N 

年龄别死亡率 age-specific death rate 3： 
P 

配对设计 paired design 60 
配对样本均数 / 检验 paired/test 60 
偏回归系数 partial regression coefficient 
偏似然函数 partial likelihood function 
频数表 frequency table 7 
平均数 average 9 

平行组设计 parallel groups design 156 
Q 

区间估计 interval estimation 51 
S 

三臂试验 three-arm trial 156 

散点图 scatter plot 44 
翊失数据 censored data 139 

生存分析 survival analysis 139 
生存函数 survival function 140 
生存率 survival rate 140 
生存时间 survival time 139 

生存数据 survival data 139 

时变 time-dependent 148 
实际频数 actual frequency 84 
实验对象 experimental subject 151 

实验对照 experimental control 153 

实验设计 experimental design 151 
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实验效应 experimental effect 152 
试验 trial 151 
数据 data 3 

双臂试验 two-arm trial 156 
双变量正态分布 bivariate normal distribution 108 
双盲 double blind 156 
水平 level 151 
死亡率 mortality rate 31 
死因别死亡率 cause specific death rate 32 
死因构成 proportion of dying of a specific cause 
32 

四分位数间距 quartile range 14 
四格表 fourfold table 84 
似然比检验 likelihood ratio test 128 
算术均数 arithmetic mean 9 
随机测量误差 random measurement error 4 
随机对照试验 randomized controlled trial, RCT 
155 

随机化 randomization 154 

随机区组设计 randomized block design 73 

随机数 random number 154 

随机数字表 table of random number 154 

T 

条件 logistic 回归 conditional logistic regression 
131 

同质 homogeneity 2 
统计表 statistical table 36 
统计量 statistic 4 
统计图 statistical chart 39 
W 

完全数据 complete data 139 

完全随机设计 completely randomized design 70 

无相关 zero correlation 109 

误差 error 4 

误差条图 error bars 44 

X 

析因设计 factorial design 77 ， 157 


系统误差 systematic error 4 
显著性检验 significant test 55 
显著性水准 significant level 57 
线图 line chart 41 

线性回归方程 linear regression equation 104 
相对比 relative ratio 29 
相对数 relative number 28 
相对危险度 relative risk, RR 126 
相关系数 correlation coefficient 109 
相互对照 mutual control 154 
箱式图 box plot 43 
向后选择法 backward elimination 119 
向前选择法 forward selection 119 


哑变量 dummy variable 121 
研究对象 study subject 151 
研究因素 study factor 151 
样本 sample 3 
样本含量 sample size 158 
医学统计学 medical statistics 1 
应变量 dependent variable 104 
优效性 superiority 157 
有序数据 ordinal data 3 
原假设 null hypothesis 56 
圆图 pie chart 46 


正态分布 normal distribution 9 

正相关 positive correlation 108 

直方图 histogram 8, 40 

直条图 bar chart 45 

直线相关 linear correlation 108 

治愈率 cure rate 32 

中位生存期 median survival time 140 

中位数 median 11 

逐步选择法 stepwise selection 119 

主效应 main effect 78 

准确度 accuracy 153 

自变量 independent variable 104 
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自身对照 self-control 153 
自由度 degree of freedom \A 
总体 population 3 


m likelihood estimate, MLE 


最小二乘法 method of least squares 104 
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